From 1118ad12f77a4ab9e1a1774cfea4df36c1d71305 Mon Sep 17 00:00:00 2001
From: 98MM <47939788+98MM@users.noreply.github.com>
Date: Thu, 4 Jul 2024 09:04:52 +0200
Subject: [PATCH 1/9] added complex synthetic feature generators

Added a suite of functions related to synthetic feature generation.
---
 .idea/.gitignore                              |   8 +
 .../inspectionProfiles/profiles_settings.xml  |   6 +
 .idea/misc.xml                                |   7 +
 .idea/modules.xml                             |   8 +
 .idea/outrank.iml                             |  14 +
 .idea/vcs.xml                                 |   6 +
 .../synthetic_data_generators/cc_generator.py | 702 ++++++++++++++++++
 tests/cc_generator_tests.py                   | 157 ++++
 8 files changed, 908 insertions(+)
 create mode 100644 .idea/.gitignore
 create mode 100644 .idea/inspectionProfiles/profiles_settings.xml
 create mode 100644 .idea/misc.xml
 create mode 100644 .idea/modules.xml
 create mode 100644 .idea/outrank.iml
 create mode 100644 .idea/vcs.xml
 create mode 100644 outrank/algorithms/synthetic_data_generators/cc_generator.py
 create mode 100644 tests/cc_generator_tests.py
diff --git a/.idea/.gitignore b/.idea/.gitignore
new file mode 100644
index 0000000..13566b8
--- /dev/null
+++ b/.idea/.gitignore
@@ -0,0 +1,8 @@
+# Default ignored files
+/shelf/
+/workspace.xml
+# Editor-based HTTP Client requests
+/httpRequests/
+# Datasource local storage ignored files
+/dataSources/
+/dataSources.local.xml
diff --git a/.idea/inspectionProfiles/profiles_settings.xml b/.idea/inspectionProfiles/profiles_settings.xml
new file mode 100644
index 0000000..105ce2d
--- /dev/null
+++ b/.idea/inspectionProfiles/profiles_settings.xml
@@ -0,0 +1,6 @@
+<component name="InspectionProjectProfileManager">
+  <settings>
+    <option name="USE_PROJECT_PROFILE" value="false" />
+    <version value="1.0" />
+  </settings>
+</component>
\ No newline at end of file
diff --git a/.idea/misc.xml b/.idea/misc.xml
new file mode 100644
index 0000000..877d184
--- /dev/null
+++ b/.idea/misc.xml
@@ -0,0 +1,7 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<project version="4">
+  <component name="Black">
+    <option name="sdkName" value="Python 3.12 (outrank)" />
+  </component>
+  <component name="ProjectRootManager" version="2" project-jdk-name="Python 3.12 (outrank)" project-jdk-type="Python SDK" />
+</project>
\ No newline at end of file
diff --git a/.idea/modules.xml b/.idea/modules.xml
new file mode 100644
index 0000000..3c2f566
--- /dev/null
+++ b/.idea/modules.xml
@@ -0,0 +1,8 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<project version="4">
+  <component name="ProjectModuleManager">
+    <modules>
+      <module fileurl="file://$PROJECT_DIR$/.idea/outrank.iml" filepath="$PROJECT_DIR$/.idea/outrank.iml" />
+    </modules>
+  </component>
+</project>
\ No newline at end of file
diff --git a/.idea/outrank.iml b/.idea/outrank.iml
new file mode 100644
index 0000000..8e5446a
--- /dev/null
+++ b/.idea/outrank.iml
@@ -0,0 +1,14 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<module type="PYTHON_MODULE" version="4">
+  <component name="NewModuleRootManager">
+    <content url="file://$MODULE_DIR$">
+      <excludeFolder url="file://$MODULE_DIR$/venv" />
+    </content>
+    <orderEntry type="inheritedJdk" />
+    <orderEntry type="sourceFolder" forTests="false" />
+  </component>
+  <component name="PyDocumentationSettings">
+    <option name="format" value="PLAIN" />
+    <option name="myDocStringFormat" value="Plain" />
+  </component>
+</module>
\ No newline at end of file
diff --git a/.idea/vcs.xml b/.idea/vcs.xml
new file mode 100644
index 0000000..35eb1dd
--- /dev/null
+++ b/.idea/vcs.xml
@@ -0,0 +1,6 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<project version="4">
+  <component name="VcsDirectoryMappings">
+    <mapping directory="" vcs="Git" />
+  </component>
+</project>
\ No newline at end of file
diff --git a/outrank/algorithms/synthetic_data_generators/cc_generator.py b/outrank/algorithms/synthetic_data_generators/cc_generator.py
new file mode 100644
index 0000000..2f00f7e
--- /dev/null
+++ b/outrank/algorithms/synthetic_data_generators/cc_generator.py
@@ -0,0 +1,702 @@
+import numpy as np
+from scipy.linalg import qr
+from scipy.stats import norm
+from sklearn.cluster import KMeans
+from sklearn.utils import resample
+from typing import List, Union, Optional, Tuple
+class CategoricalClassification:
+
+    def __init__(self):
+        self.dataset_info = {
+            'general': {},
+            'combinations': [],
+            'correlations': [],
+            'duplicates': [],
+            'labels': [],
+            'noise': []
+        }
+
+    def __repr__(self):
+        return f"CategoricalClassification(dataset_info={self.dataset_info})"
+
+    def generate_data(self,
+                      n_features: int,
+                      n_samples: int,
+                      cardinality: int = 5,
+                      structure: Optional = None,
+                      ensure_rep: bool = False,
+                      seed: int = 42) -> np.ndarray:
+
+        """
+        Generates dataset based on parameters
+        :param n_features: number of generated features
+        :param n_samples: number of generated samples
+        :param cardinality: default cardinality of the dataset
+        :param structure: structure of the dataset
+        :param ensure_rep: flag, ensures all given values represented
+        :param seed: sets seed of numpy random
+        :return: X, 2D dataset
+        """
+
+        self.dataset_info.update({
+            'general': {
+                'n_features': n_features,
+                'n_samples': n_samples,
+                'cardinality': cardinality,
+                'structure': structure,
+                'ensure_rep': ensure_rep,
+                'seed': seed
+            }
+        })
+
+        np.random.seed(seed)
+        X = np.empty([n_features, n_samples])
+
+        if structure == None:
+
+            for i in range(n_features):
+                x = self._generate_feature(cardinality, n_samples, ensure_rep=ensure_rep)
+                X[i] = x
+
+        else:
+
+            ix = 0
+            for data in structure:
+
+                if not isinstance(data[0], (list, np.ndarray)):
+                    feature_ix = data[0]
+                    feature_cardinality = data[1]
+
+                    if ix < feature_ix:
+                        for i in range(ix, feature_ix):
+                            x = self._generate_feature(cardinality, n_samples, ensure_rep=ensure_rep)
+                            X[ix] = x
+                            ix += 1
+
+                    if not isinstance(feature_cardinality, (list, np.ndarray)):
+                        x = self._generate_feature(feature_cardinality, n_samples, ensure_rep=ensure_rep)
+                    else:
+                        if isinstance(feature_cardinality[0], (list, np.ndarray)):
+                            value_domain = feature_cardinality[0]
+                            value_frequencies = feature_cardinality[1]
+                            x = self._generate_feature(value_domain, n_samples, ensure_rep=ensure_rep, p=value_frequencies)
+                        else:
+                            value_domain = feature_cardinality
+                            x = self._generate_feature(value_domain, n_samples, ensure_rep=ensure_rep)
+                    X[ix] = x
+                    ix += 1
+
+                else:
+                    feature_ixs = data[0]
+                    feature_cardinality = data[1]
+                    for feature_ix in feature_ixs:
+                        if ix < feature_ix:
+                            for i in range(ix, feature_ix):
+                                x = self._generate_feature(cardinality, n_samples, ensure_rep=ensure_rep)
+                                X[ix] = x
+                                ix += 1
+
+                        if not isinstance(feature_cardinality, (list, np.ndarray)):
+                            x = self._generate_feature(feature_cardinality, n_samples, ensure_rep=ensure_rep)
+                        else:
+                            value_domain = feature_cardinality[0]
+                            value_frequencies = feature_cardinality[1]
+                            x = self._generate_feature(value_domain, n_samples, ensure_rep=ensure_rep, p=value_frequencies)
+                        X[ix] = x
+                        ix += 1
+
+            if ix < n_features:
+                for i in range(ix, n_features):
+                    x = self._generate_feature(cardinality, n_samples, ensure_rep=ensure_rep)
+                    X[i] = x
+
+        return X.T
+
+    def _generate_feature(self,
+                          v: Union[int, List[int], np.ndarray],
+                          size: int,
+                          ensure_rep: bool = False,
+                          p: Optional[Union[List[float], np.ndarray]] = None) -> np.ndarray:
+        """
+        Generates feature vector of length size. Default probability density distribution is approx. normal, centred around randomly picked value.
+        :param v: either int for cardinality, or list of values
+        :param size: length of feature vector
+        :param ensure_rep: ensures all values are represented at least once in the feature vector
+        :param p: list of probabilities of each value
+        :return:
+        """
+        if not isinstance(v, (list, np.ndarray)):
+            v = np.arange(0, v, 1)
+        else:
+            v = np.array(v)
+
+        if p is None:
+            v_shift = v - v[np.random.randint(len(v))]
+            p = norm.pdf(v_shift, scale=3)
+        else:
+            p = np.array(p)
+
+        p = p / p.sum()
+
+        if ensure_rep and len(v) < size:
+            sampled_values = np.random.choice(v, size=(size - len(v)), p=p)
+            sampled_values = np.append(sampled_values, v)
+        else:
+            sampled_values = np.random.choice(v, size=size, p=p)
+
+        np.random.shuffle(sampled_values)
+        return sampled_values
+
+    def generate_combinations(self,
+                              X: np.ndarray,
+                              feature_indices: Union[List[int], np.ndarray],
+                              combination_function: Optional = None,
+                              combination_type: str ='linear') -> np.ndarray:
+        """
+        Generates linear, nonlinear, or custom combinations within feature vectors in given dataset X
+        :param X: dataset
+        :param feature_indices: indexes of features to be in combination
+        :param combination_function: optional custom function for combining feature vectors
+        :param combination_type: string flag, either liner or nonlinear, defining combination type
+        :return: X with added resultant feature
+        """
+
+
+        selected_features = X[:, feature_indices]
+
+        if combination_function is None:
+            if combination_type == 'linear':
+                combination_function = lambda x: np.sum(x, axis=1)
+            elif combination_type == 'nonlinear':
+                combination_function = lambda x: np.sin(np.sum(x, axis=1))
+        else:
+            combination_type = str(combination_function.__name__)
+
+        combination_result = combination_function(selected_features)
+
+        combination_ix = len(X[0])
+
+        self.dataset_info['combinations'].append({
+            'feature_indices': feature_indices,
+            'combination_type': combination_type,
+            'combination_ix': combination_ix
+        })
+
+        return np.column_stack((X, combination_result))
+
+    def _xor(self, arr):
+        """
+        Performs bitwise XOR operation on two integer arrays
+        :param a: array
+        :param b: array
+        :return: bitwise XOR result
+        """
+        arrT = arr.T
+        arrT = arrT.astype(int)
+        out = np.bitwise_xor(arrT[0], arrT[1])
+        if len(arrT) > 2:
+            for i in range(2, len(arrT)):
+                out = np.bitwise_xor(out, arrT[i])
+
+        return out.T
+
+    def _and(self, arr):
+        """
+        Performs bitwise AND operation on two integer arrays
+        :param a: array
+        :param b: array
+        :return: bitwise AND result
+        """
+        arrT = arr.T
+        arrT = arrT.astype(int)
+        out = np.bitwise_xor(arrT[0], arrT[1])
+        if len(arrT) > 2:
+            for i in range(2, len(arrT)):
+                out = np.bitwise_and(out, arrT[i])
+
+        return out.T
+
+    def _or(self, arr):
+        """
+        Performs bitwise OR operation on two integer arrays
+        :param a: array
+        :param b: array
+        :return: bitwise OR result
+        """
+        arrT = arr.T
+        arrT = arrT.astype(int)
+        out = np.bitwise_xor(arrT[0], arrT[1])
+        if len(arrT) > 2:
+            for i in range(2, len(arrT)):
+                out = np.bitwise_or(out, arrT[i])
+
+        return out.T
+    def generate_correlated(self,
+                            X: np.ndarray,
+                            feature_indices: Union[List[int], np.ndarray],
+                            r: float = 0.8) -> np.ndarray:
+
+        """
+        Generates correlated features using the given feature indices. Correlation is based on cosine of angle between vectors with mean 0.
+        :param X: dataset
+        :param feature_indices: indices of features to generate correlated feature to
+        :param r: (Pearson) correlation factor
+        :return: X with generated correlated  features
+        """
+
+        if not isinstance(feature_indices, (list, np.ndarray)):
+            feature_indices = np.array([feature_indices])
+
+        if len(feature_indices) > 1:
+            correlated_ixs = np.arange(len(X[0]), (len(X[0]) + len(feature_indices)), 1)
+        else:
+            correlated_ixs = len(X[0])
+
+        selected_features = X[:, feature_indices]
+        transposed = np.transpose(selected_features)
+        correlated_features = []
+
+        for t in transposed:
+            theta = np.arccos(r)
+            t_standard = (t - np.mean(t)) / (np.std(t) + 1e-10)
+
+            rand = np.random.normal(0, 1, len(t_standard))
+            rand = (rand - np.mean(rand)) / (np.std(rand) + 1e-10)
+
+            M = np.column_stack((t_standard, rand))
+            M_centred = (M - np.mean(M, axis=0))
+
+            Id = np.eye(len(t))
+            Q = qr(M_centred[:, [0]], mode='economic')[0]
+            P = np.dot(Q, Q.T)
+            orthogonal_projection = np.dot(Id - P, M_centred[:, 1])
+            M_orthogonal = np.column_stack((M_centred[:, 0], orthogonal_projection))
+
+            Y = np.dot(M_orthogonal, np.diag(1 / np.sqrt(np.sum(M_orthogonal ** 2, axis=0))))
+            corr = Y[:, 1] + (1 / np.tan(theta)) * Y[:, 0]
+
+            correlated_features.append(corr)
+
+        correlated_features = np.transpose(correlated_features)
+
+        self.dataset_info['correlations'].append({
+            'feature_indices': feature_indices,
+            'correlated_indices': correlated_ixs,
+            'correlation_factor': r
+        })
+
+        return np.column_stack((X, correlated_features))
+
+    def generate_duplicates(self,
+                            X: np.ndarray,
+                            feature_indices: Union[List[int], np.ndarray]) -> np.ndarray:
+        """
+        Generates duplicate features
+        :param X: dataset
+        :param feature_indices: indices of features to duplicate
+        :return: dataset with duplicated features
+        """
+        if not isinstance(feature_indices, (list, np.ndarray)):
+            feature_indices = np.array([feature_indices])
+
+        duplicated_ixs = np.arange(len(X[0]), (len(X[0]) + len(feature_indices) - 1), 1)
+
+        selected_features = X[:, feature_indices]
+
+        self.dataset_info['duplicates'].append({
+            'feature_indices': feature_indices,
+            'duplicate_indices': duplicated_ixs
+        })
+
+        return np.column_stack((X, selected_features))
+
+    def generate_labels(self,
+                        X: np.ndarray,
+                        n: int = 2,
+                        p: Union[float, list[float], np.ndarray] = 0.5,
+                        k: Union[int, float] = 2,
+                        decision_function: Optional = None,
+                        class_relation: str ='linear',
+                        balance: bool = False):
+        """
+        Generates labels for dataset X
+        :param X: dataset
+        :param n: number of class labels
+        :param p: class distribution
+        :param k: constant
+        :param decision_function: optional user-defined decision function
+        :param class_relation: string, either 'linear', 'nonlinear', or 'cluster'
+        :param balance: boolean, whether to balance clustering class labels
+        :return: array of labels, corresponding to dataset X
+        """
+
+        if isinstance(p, (list, np.ndarray)):
+            if sum(p) > 1: raise ValueError('sum of values in must be less than 1.0')
+            if len(p) > n: raise ValueError('length of p must equal n')
+
+        if p > 1: raise ValueError('p must be less than 1.0')
+
+        n_samples, n_features = X.shape
+
+        if decision_function is None:
+            if class_relation == 'linear':
+                decision_function = lambda x: np.sum(2 * x + 3, axis=1)
+            elif class_relation == 'nonlinear':
+                decision_function = lambda x: np.sum(k * np.sin(x) + k * np.cos(x), axis=1)
+            elif class_relation == 'cluster':
+                decision_function = None
+        else:
+            class_relation = str(decision_function.__name__)
+
+        y = []
+        if decision_function is not None:
+            if n > 2:
+                if type(p) != list:
+                    p = 1 / n
+                    percentiles = [p * 100]
+                    for i in range(1, n - 1):
+                        percentiles.append(percentiles[i - 1] + (p * 100))
+
+                    decision_boundary = decision_function(X)
+                    p_points = np.percentile(decision_boundary, percentiles)
+
+                    y = np.zeros_like(decision_boundary, dtype=int)
+                    for p_point in p_points:
+                        y += (decision_boundary > p_point)
+                else:
+                    decision_boundary = decision_function(X)
+                    percentiles = [x * 100 for x in p]
+
+                    for i in range(1, len(percentiles) - 1):
+                        percentiles[i] += percentiles[i - 1]
+
+                    percentiles.insert(0, 0)
+                    percentiles.pop()
+                    print(percentiles)
+
+                    p_points = np.percentile(decision_boundary, percentiles)
+                    print(p_points)
+
+                    y = np.zeros_like(decision_boundary, dtype=int)
+                    for i in range(1, n):
+                        p_point = p_points[i]
+                        for j in range(len(decision_boundary)):
+                            if decision_boundary[j] > p_point:
+                                y[j] += 1
+            else:
+                decision_boundary = decision_function(X)
+                p_point = np.percentile(decision_boundary, p * 100)
+                y = np.where(decision_boundary > p_point, 1, 0)
+        else:
+            if p == 0.5:
+                p = 1.0
+            else:
+                p = [p, 1 - p]
+            y = self._cluster_data(X, n, p=p, balance=balance)
+
+        self.dataset_info.update({
+            'labels': {
+                'class_relation': class_relation,
+                'n_class': n
+            }
+        })
+
+        return y
+
+    def _cluster_data(self,
+                      X: np.ndarray,
+                      n: int,
+                      p: Optional[Union[float, List[float], np.ndarray]] = 1.0,
+                      balance: bool = False) -> np.ndarray:
+        """
+        Cluster data using kmeans
+        :param X: dataset
+        :param n: number of clusters
+        :param p: class distribution
+        :param balance: balance the clusters according to p
+        :return: array of labels, corresponding to dataset X
+        """
+
+        kmeans = KMeans(n_clusters=n)
+
+        kmeans.fit(X)
+
+        cluster_labels = kmeans.labels_
+
+        if not isinstance(p, (list, np.ndarray)):  # Fully balanced clusters
+            samples_per_cluster = [len(X) // n] * n
+        else:
+            samples = len(X)
+            samples_per_cluster = []
+            if not isinstance(p, (list, np.ndarray)):
+                samples_per_cluster.append(int(samples * p) // n)
+                samples_per_cluster.append(int(samples * (1 - p)) // n)
+            else:
+                if len(p) == n:
+                    for val in p:
+                        samples_per_cluster.append(int(samples * val))
+                else:
+                    raise Exception("Length of balance parameter must equal number of clusters.")
+
+        # Adjust cluster sizes
+        if balance:
+            adjustments = []
+            overflow_samples = []
+            overflow_indices = []
+            for i in range(n):
+                cluster_size = np.sum(cluster_labels == i)
+
+                adjustment = samples_per_cluster[i] - cluster_size
+                adjustments.append(adjustment)
+
+                if adjustment < 0:  # Cluter is too large
+
+                    centroid = kmeans.cluster_centers_[i]
+                    dataset_indices = np.where(cluster_labels == i)[0]  # Indices of samples in dataset
+                    cluster_samples = np.copy(X[dataset_indices])
+
+                    distances = np.linalg.norm(cluster_samples - centroid,
+                                               axis=1)  # Distances of cluster samples to cluster centroid
+                    cluster_sample_indices = np.argsort(distances)
+                    dataset_indices_sorted = dataset_indices[
+                        cluster_sample_indices]  # Indices of samples sorted by sample distance to cluster centroid
+
+                    overflow_sample_indices = cluster_sample_indices[samples_per_cluster[i]:]  # Overflow samples
+                    dataset_indices_sorted = dataset_indices_sorted[
+                                             samples_per_cluster[i]:]  # Dataset indices of overflow samples
+
+                    for i in range(len(overflow_sample_indices)):
+                        overflow_samples.append(cluster_samples[overflow_sample_indices[i]])
+                        overflow_indices.append(dataset_indices_sorted[i])
+
+            overflow_samples = np.array(overflow_samples)
+            overflow_indices = np.array(overflow_indices)
+
+            # Making adjustments
+            for i in range(n):
+
+                if adjustments[i] > 0:
+                    centroid = kmeans.cluster_centers_[i]
+                    distances = np.linalg.norm(overflow_samples - centroid, axis=1)
+
+                    closest_sample_indices = np.argsort(distances)
+
+                    overflow_indices_sorted = overflow_indices[closest_sample_indices]
+
+                    sample_indices_slice = closest_sample_indices[:adjustments[i]]
+                    overflow_indices_slice = overflow_indices_sorted[:adjustments[i]]
+
+                    cluster_labels[overflow_indices_slice] = i
+
+                    overflow_samples = np.delete(overflow_samples, sample_indices_slice, axis=0)
+                    overflow_indices = np.delete(overflow_indices, sample_indices_slice, axis=0)
+
+        return np.array(cluster_labels)
+
+    def generate_noise(self,
+                       X: np.ndarray,
+                       y: Union[List[int], np.ndarray],
+                       p: float = 0.2,
+                       type: str = "categorical",
+                       missing_val: Union[str, int, float] = float('-inf')) -> np.ndarray:
+
+        """
+        Simulates noise on given dataset X
+        :param X: dataset to apply noise to
+        :param y: required target labels for categorical noise generation
+        :param p: amount of noise to apply. Defaults to 0.2
+        :param type: type of noise to apply, either categorical or missing
+        :param missing_val: value to simulate missing values. Defaults to float('-inf')
+        :return: X with noise applied
+        """
+
+        self.dataset_info['noise'].append({
+            'type': type,
+            'amount': p
+        })
+
+        if type == "categorical":
+            label_values, label_count = np.unique(y, return_counts=True)
+            n_labels = len(label_values)
+
+            inds = y.argsort()
+            y_sort = y[inds]
+            X_sort = X[inds]
+
+            Xs_T = X_sort.T
+            n = Xs_T.shape[1]
+            n_flip = int(n * p)
+
+            for feature in Xs_T:
+                unique_per_label = {}
+
+                for i in range(n_labels):
+                    if i == 0:
+                        unique = np.unique(feature[:label_count[i]])
+                        unique_per_label[label_values[i]] = set(unique)
+                    else:
+                        unique = np.unique(feature[label_count[i - 1]:label_count[i - 1] + label_count[i] - 1])
+                        unique_per_label[label_values[i]] = set(unique)
+
+                ixs = np.random.choice(n, n_flip, replace=False)
+
+                for ix in ixs:
+                    current_label = y_sort[ix]
+                    possible_labels = np.where(label_values != current_label)[0]
+
+                    # find all unique values from labels != current label
+                    values = set()
+                    for key in possible_labels:
+                        values = values.union(unique_per_label[key])
+
+                    # remove any overlapping values, ensuring replacement values are unique & from a target label !=
+                    # current label
+                    for val in unique_per_label[current_label] & values:
+                        values.remove(val)
+
+                    if len(values) > 0:
+                        val = np.random.choice(list(values))
+
+                    else:
+                        key = possible_labels[np.random.randint(len(possible_labels))]
+                        values = unique_per_label[key]
+                        val = np.random.choice(list(values))
+
+                    feature[ix] = val
+
+            rev_ind = inds.argsort()
+            X_noise = Xs_T.T
+            X_noise = X_noise[rev_ind]
+
+            return X_noise
+
+        elif type == "missing":
+            X_noise = np.copy(X)
+            Xn_T = X_noise.T
+            n = Xn_T.shape[1]
+            n_missing = int(n * p)
+            #print("n to delete:", n_missing)
+
+            for feature in Xn_T:
+                ixs = np.random.choice(n, n_missing, replace=False)
+
+                for ix in ixs:
+                    feature[ix] = missing_val
+
+            return Xn_T.T
+
+    def downsample_dataset(self,
+                           X: np.array,
+                           y: Union[List[int], np.ndarray],
+                           N: Optional[Union[int, None]] = None,
+                           seed: int = 42,
+                           reshuffle: bool=False) -> Tuple[np.array, np.ndarray]:
+
+        """
+        Downsamples dataset X according to N or the number of samples in minority class, resulting in a balanced dataset.
+        :param X: Dataset to downsample
+        :param y: Labels corresponding to X
+        :param N: Optional number of samples per class to downsample to
+        :param seed: Seed for random state of resample function
+        :param reshuffle: Reshuffle the dataset after downsampling
+        :return: Balanced X and y after downsampling
+        """
+
+        original_shape = X.shape
+
+        values, counts = np.unique(y, return_counts=True)
+        if N is None:
+            N = min(counts)
+
+        if N > min(counts):
+            raise ValueError("N must be equal to or less than the number of samples in minority class")
+
+        X_arrays_list = []
+        y_downsampled = []
+        for label in values:
+            X_label = [X[i] for i in range(len(y)) if y[i] == label]
+            X_label_downsample = resample(X_label,
+                                          replace=True,
+                                          n_samples=N,
+                                          random_state=seed)
+            X_arrays_list.append(X_label_downsample)
+            ys = [label] * N
+            y_downsampled = np.concatenate((y_downsampled, ys), axis=0)
+
+        X_downsampled = np.concatenate(X_arrays_list, axis=0)
+
+        if reshuffle:
+            indices = np.arange(len(X_downsampled))
+            np.random.shuffle(indices)
+            X_downsampled = X_downsampled[indices]
+            y_downsampled = y_downsampled[indices]
+
+        downsampled_shape = X_downsampled.shape
+
+        self.dataset_info.update({
+            'downsampling': {
+                'original_shape': original_shape,
+                'downsampled_shape': downsampled_shape
+            }
+        })
+
+        return X_downsampled, y_downsampled
+
+    def print_dataset(self, X, y):
+        """
+        Prints given dataset
+        :param X: dataset
+        :param y: labels
+        :return:
+        """
+
+        n_samples, n_features = X.shape
+        n = 0
+        for arr in X:
+            print('[', end='')
+            for i in range(n_features):
+                if i == n_features - 1:
+                    print(arr[i], end='')
+                else:
+                    print(arr[i], end=', ')
+            print("], Label: {}".format(y[n]))
+            n += 1
+
+
+    def summarize(self):
+
+        print(f"Number of features: {self.dataset_info['general']['n_features']}")
+        print(f"Number of generated samples: {self.dataset_info['general']['n_samples']}")
+        if self.dataset_info['downsampling']:
+            print(f"Dataset downsampled from shape {self.dataset_info['downsampling']['original_shape']},to shape {self.dataset_info['downsampling']['downsampled_shape']}")
+        print(f"Number of classes: {self.dataset_info['labels']['n_class']}")
+        print(f"Class relation: {self.dataset_info['labels']['class_relation']}")
+
+
+        print('-------------------------------------')
+
+        if len(self.dataset_info['combinations']) > 0:
+            print("Combinations:")
+            for comb in self.dataset_info['combinations']:
+                print(f"Features {comb['feature_indices']} are in {comb['combination_type']} combination, result in {comb['combination_ix']}")
+            print('-------------------------------------')
+
+        if len(self.dataset_info['correlations']) > 0:
+            print("Correlations:")
+            for corr in self.dataset_info['correlations']:
+                print(f"Features {corr['feature_indices']} are correlated to {corr['correlated_indices']} with a factor of {corr['correlation_factor']}")
+            print('-------------------------------------')
+
+        if len(self.dataset_info['duplicates']) > 0:
+            print("Duplicates:")
+            for dup in self.dataset_info['duplicates']:
+                print(f"Features {dup['feature_indices']} are duplicated, duplicate indexes are {dup['duplicate_indices']}")
+            print('-------------------------------------')
+
+        if len(self.dataset_info['noise']) > 0:
+            print("Simulated noise:")
+            for noise in self.dataset_info['noise']:
+                print(f"Simulated {noise['type']} noise, amount of {noise['noise_amount']}")
+            print('-------------------------------------')
+
+        print("\nFor more information on dataset structure, print cc.dataset_info['general']['structure']")
\ No newline at end of file
diff --git a/tests/cc_generator_tests.py b/tests/cc_generator_tests.py
new file mode 100644
index 0000000..e5665f6
--- /dev/null
+++ b/tests/cc_generator_tests.py
@@ -0,0 +1,157 @@
+import pytest
+import numpy as np
+from scipy.stats import pearsonr
+from outrank.algorithms.synthetic_data_generators.cc_generator import CategoricalClassification
+
+@pytest.fixture
+def cc_instance():
+    return CategoricalClassification()
+
+def test_init(cc_instance):
+    assert cc_instance.dataset_info == ''
+
+def test_generate_data_shape_and_type(cc_instance):
+    X = cc_instance.generate_data(n_features=5, n_samples=100)
+    assert isinstance(X, np.ndarray), "Output should be a numpy array"
+    assert X.shape == (100, 5), "Shape should be (n_samples, n_features)"
+
+def test_generate_data_cardinality(cc_instance):
+    n_features = 5
+    cardinality = 3
+    X = cc_instance.generate_data(n_features=n_features, n_samples=100, cardinality=cardinality)
+    unique_values = np.unique(X)
+    assert len(unique_values) <= cardinality, "Cardinality not respected for all features"
+
+def test_generate_data_ensure_rep(cc_instance):
+    n_features = 5
+    cardinality = 50
+    X = cc_instance.generate_data(n_features=n_features, n_samples=100, cardinality=cardinality, ensure_rep=True)
+    unique_values = np.unique(X)
+    assert len(unique_values) == cardinality, "Not all values represented when 'ensure_rep=True'"
+
+def test_generate_feature_shape_and_type(cc_instance):
+    feature = cc_instance._generate_feature(5, size=100)
+    assert isinstance(feature, np.ndarray), "Output should be a numpy array"
+    assert feature.shape == (100,), "Shape should be (size,)"
+
+def test_generate_feature_cardinality(cc_instance):
+    feature = cc_instance._generate_feature(5, size=100)
+    unique_values = np.unique(feature)
+    assert len(unique_values) <= 5, "Feature cardinality not respected for all features"
+
+def test_generate_feature_ensure_rep(cc_instance):
+    feature = cc_instance._generate_feature(50, size=100, ensure_rep=True)
+    unique_values = np.unique(feature)
+    assert len(unique_values) == 50, "Not all values represented when using 'ensure_rep=True'"
+
+def test_generate_feature_values(cc_instance):
+    values = [5, 6, 7, 8, 9, 10]
+    feature = cc_instance._generate_feature(values, size=100)
+    unique_values = np.unique(feature)
+    assert any(f in feature for f in values), "Feature values not in input list"
+def test_generate_feature_values_ensure_rep(cc_instance):
+    values = [5, 6, 7, 8, 9, 10]
+    feature = cc_instance._generate_feature(values, size=100, ensure_rep=True)
+    unique_values = np.unique(feature)
+    assert (values == unique_values).all(), "Feature values should match input list when 'ensure_rep=True'"
+
+def test_generate_feature_density(cc_instance):
+    values = [0, 1, 2]
+    p = [0.2, 0.4, 0.4]
+    feature = cc_instance._generate_feature(values, size=10000, ensure_rep=True, p=p)
+    values, counts = np.unique(feature, return_counts=True)
+    generated_p = np.round(counts/10000, decimals=1)
+    assert (generated_p == p).all(), "Feature values should have density roughly equal to 'p'"
+
+def test_generate_combinations_shape_and_type(cc_instance):
+    X = cc_instance.generate_data(n_features=5, n_samples=100)
+    indices = [0,1]
+    X = cc_instance.generate_combinations(X, indices, combination_type='linear')
+    assert isinstance(X, np.ndarray), "Output should be a numpy array"
+    assert X.shape == (100, 6), "Shape should be (n_samples, n_features + 1)"
+
+def test_generate_correlated_shape_and_type(cc_instance):
+    X = cc_instance.generate_data(n_features=5, n_samples=100)
+    indices = 0
+    X = cc_instance.generate_correlated(X, indices, r=0.8)
+    assert isinstance(X, np.ndarray), "Output should be a numpy array"
+    assert X.shape == (100, 6), "Shape should be (n_samples, n_features + 1)"
+
+def test_generate_correlated_correlaton(cc_instance):
+    X = cc_instance.generate_data(n_features=5, n_samples=100)
+    indices = 0
+    X = cc_instance.generate_correlated(X, indices, r=0.8)
+    Xt = X.T
+    corr, _ = pearsonr(Xt[0], Xt[5])
+    assert np.round(corr, decimals=1) == 0.8, "Resultant correlation should be equal to the 'r' parameter"
+
+
+def test_generate_duplicates_shape_and_type(cc_instance):
+    X = cc_instance.generate_data(n_features=5, n_samples=100)
+    indices = 0
+    X = cc_instance.generate_duplicates(X, indices)
+    assert isinstance(X, np.ndarray), "Output should be a numpy array"
+    assert X.shape == (100, 6), "Shape should be (n_samples, n_features + 1)"
+
+def test_generate_duplicates_duplication(cc_instance):
+    X = cc_instance.generate_data(n_features=5, n_samples=100)
+    indices = 0
+    X = cc_instance.generate_duplicates(X, indices)
+    Xt = X.T
+    assert (Xt[0] == Xt[-1]).all()
+
+def test_xor_operation(cc_instance):
+    a = np.array([1, 0, 1])
+    b = np.array([0, 1, 1])
+    arr = [a, b]
+    result = cc_instance._xor(arr)
+    expected = np.array([1, 1, 0])
+    assert np.array_equal(result, expected), "XOR operation did not produce expected result"
+
+def test_and_operation(cc_instance):
+    a = np.array([1, 0, 1])
+    b = np.array([0, 1, 1])
+    arr = [a, b]
+    result = cc_instance._and(arr)
+    expected = np.array([0, 0, 1])
+    assert np.array_equal(result, expected), "AND operation did not produce expected result"
+
+def test_or_operation(cc_instance):
+    a = np.array([1, 0, 1])
+    b = np.array([0, 1, 1])
+    arr = [a, b]
+    result = cc_instance._or(arr)
+    expected = np.array([1, 1, 1])
+    assert np.array_equal(result, expected), "OR operation did not produce expected result"
+
+def test_generate_labels_shape_and_type(cc_instance):
+    X = cc_instance.generate_data(n_features=5, n_samples=100)
+    labels = cc_instance.generate_labels(X)
+    assert isinstance(labels, np.ndarray), "Output should be a numpy array"
+    assert labels.shape == (100,), "Shape should be (n_samples,)"
+
+def test_generate_labels_distribution(cc_instance):
+    X = cc_instance.generate_data(n_features=5, n_samples=100)
+    labels = cc_instance.generate_labels(X, n=3, p=[0.2, 0.3, 0.5])
+    unique, counts = np.unique(labels, return_counts=True)
+    distribution = counts / 100
+    expected_distribution = np.array([0.2, 0.3, 0.5])
+    assert np.allclose(distribution, expected_distribution, atol=0.1), "Label distribution does not match expected distribution"
+
+def test_generate_labels_class_relation_linear(cc_instance):
+    X = cc_instance.generate_data(n_features=5, n_samples=100)
+    labels = cc_instance.generate_labels(X, class_relation='linear')
+    assert isinstance(labels, np.ndarray), "Output should be a numpy array"
+    assert labels.shape == (100,), "Shape should be (n_samples,)"
+
+def test_generate_labels_class_relation_nonlinear(cc_instance):
+    X = cc_instance.generate_data(n_features=5, n_samples=100)
+    labels = cc_instance.generate_labels(X, class_relation='nonlinear')
+    assert isinstance(labels, np.ndarray), "Output should be a numpy array"
+    assert labels.shape == (100,), "Shape should be (n_samples,)"
+
+def test_generate_labels_class_relation_cluster(cc_instance):
+    X = cc_instance.generate_data(n_features=5, n_samples=100)
+    labels = cc_instance.generate_labels(X, class_relation='cluster', balance=True)
+    assert isinstance(labels, np.ndarray), "Output should be a numpy array"
+    assert labels.shape == (100,), "Shape should be (n_samples,)"
\ No newline at end of file

From cb04d4da1f5378d656720839f0ae31c70cd598ec Mon Sep 17 00:00:00 2001
From: 98MM <47939788+98MM@users.noreply.github.com>
Date: Fri, 5 Jul 2024 09:31:42 +0200
Subject: [PATCH 2/9] removed .idea

---
 .idea/.gitignore                               |  8 --------
 .idea/inspectionProfiles/profiles_settings.xml |  6 ------
 .idea/misc.xml                                 |  7 -------
 .idea/modules.xml                              |  8 --------
 .idea/outrank.iml                              | 14 --------------
 .idea/vcs.xml                                  |  6 ------
 6 files changed, 49 deletions(-)
 delete mode 100644 .idea/.gitignore
 delete mode 100644 .idea/inspectionProfiles/profiles_settings.xml
 delete mode 100644 .idea/misc.xml
 delete mode 100644 .idea/modules.xml
 delete mode 100644 .idea/outrank.iml
 delete mode 100644 .idea/vcs.xml

diff --git a/.idea/.gitignore b/.idea/.gitignore
deleted file mode 100644
index 13566b8..0000000
--- a/.idea/.gitignore
+++ /dev/null
@@ -1,8 +0,0 @@
-# Default ignored files
-/shelf/
-/workspace.xml
-# Editor-based HTTP Client requests
-/httpRequests/
-# Datasource local storage ignored files
-/dataSources/
-/dataSources.local.xml
diff --git a/.idea/inspectionProfiles/profiles_settings.xml b/.idea/inspectionProfiles/profiles_settings.xml
deleted file mode 100644
index 105ce2d..0000000
--- a/.idea/inspectionProfiles/profiles_settings.xml
+++ /dev/null
@@ -1,6 +0,0 @@
-<component name="InspectionProjectProfileManager">
-  <settings>
-    <option name="USE_PROJECT_PROFILE" value="false" />
-    <version value="1.0" />
-  </settings>
-</component>
\ No newline at end of file
diff --git a/.idea/misc.xml b/.idea/misc.xml
deleted file mode 100644
index 877d184..0000000
--- a/.idea/misc.xml
+++ /dev/null
@@ -1,7 +0,0 @@
-<?xml version="1.0" encoding="UTF-8"?>
-<project version="4">
-  <component name="Black">
-    <option name="sdkName" value="Python 3.12 (outrank)" />
-  </component>
-  <component name="ProjectRootManager" version="2" project-jdk-name="Python 3.12 (outrank)" project-jdk-type="Python SDK" />
-</project>
\ No newline at end of file
diff --git a/.idea/modules.xml b/.idea/modules.xml
deleted file mode 100644
index 3c2f566..0000000
--- a/.idea/modules.xml
+++ /dev/null
@@ -1,8 +0,0 @@
-<?xml version="1.0" encoding="UTF-8"?>
-<project version="4">
-  <component name="ProjectModuleManager">
-    <modules>
-      <module fileurl="file://$PROJECT_DIR$/.idea/outrank.iml" filepath="$PROJECT_DIR$/.idea/outrank.iml" />
-    </modules>
-  </component>
-</project>
\ No newline at end of file
diff --git a/.idea/outrank.iml b/.idea/outrank.iml
deleted file mode 100644
index 8e5446a..0000000
--- a/.idea/outrank.iml
+++ /dev/null
@@ -1,14 +0,0 @@
-<?xml version="1.0" encoding="UTF-8"?>
-<module type="PYTHON_MODULE" version="4">
-  <component name="NewModuleRootManager">
-    <content url="file://$MODULE_DIR$">
-      <excludeFolder url="file://$MODULE_DIR$/venv" />
-    </content>
-    <orderEntry type="inheritedJdk" />
-    <orderEntry type="sourceFolder" forTests="false" />
-  </component>
-  <component name="PyDocumentationSettings">
-    <option name="format" value="PLAIN" />
-    <option name="myDocStringFormat" value="Plain" />
-  </component>
-</module>
\ No newline at end of file
diff --git a/.idea/vcs.xml b/.idea/vcs.xml
deleted file mode 100644
index 35eb1dd..0000000
--- a/.idea/vcs.xml
+++ /dev/null
@@ -1,6 +0,0 @@
-<?xml version="1.0" encoding="UTF-8"?>
-<project version="4">
-  <component name="VcsDirectoryMappings">
-    <mapping directory="" vcs="Git" />
-  </component>
-</project>
\ No newline at end of file

From 30549a4c6635fca147ab122a2413451a994d6b5c Mon Sep 17 00:00:00 2001
From: 98MM <47939788+98MM@users.noreply.github.com>
Date: Mon, 8 Jul 2024 13:37:30 +0200
Subject: [PATCH 3/9] pre-commit, code review changes

pre-commit,
code review changes:
- added _feature_builder method to avoid duplicate code blocks
- added some new parameters to enable random value domains for features
---
 .../synthetic_data_generators/cc_generator.py | 391 ++++++++++++------
 tests/cc_generator_tests.py                   |  67 +--
 2 files changed, 301 insertions(+), 157 deletions(-)

diff --git a/outrank/algorithms/synthetic_data_generators/cc_generator.py b/outrank/algorithms/synthetic_data_generators/cc_generator.py
index 2f00f7e..dd148a5 100644
--- a/outrank/algorithms/synthetic_data_generators/cc_generator.py
+++ b/outrank/algorithms/synthetic_data_generators/cc_generator.py
@@ -1,9 +1,17 @@
+from __future__ import annotations
+
+from typing import List
+from typing import Optional
+from typing import Tuple
+from typing import Union
+
 import numpy as np
 from scipy.linalg import qr
 from scipy.stats import norm
 from sklearn.cluster import KMeans
 from sklearn.utils import resample
-from typing import List, Union, Optional, Tuple
+
+
 class CategoricalClassification:
 
     def __init__(self):
@@ -13,19 +21,24 @@ def __init__(self):
             'correlations': [],
             'duplicates': [],
             'labels': [],
-            'noise': []
+            'noise': [],
         }
 
     def __repr__(self):
         return f"CategoricalClassification(dataset_info={self.dataset_info})"
 
-    def generate_data(self,
-                      n_features: int,
-                      n_samples: int,
-                      cardinality: int = 5,
-                      structure: Optional = None,
-                      ensure_rep: bool = False,
-                      seed: int = 42) -> np.ndarray:
+    def generate_data(
+        self,
+        n_features: int,
+        n_samples: int,
+        cardinality: int = 5,
+        structure: list | np.ndarray | None = None,
+        ensure_rep: bool = False,
+        random_values: bool | None = False,
+        low: int | None = 0,
+        high: int | None = 1000,
+        seed: int = 42,
+    ) -> np.ndarray:
 
         """
         Generates dataset based on parameters
@@ -34,6 +47,9 @@ def generate_data(self,
         :param cardinality: default cardinality of the dataset
         :param structure: structure of the dataset
         :param ensure_rep: flag, ensures all given values represented
+        :param random_values: flag, enables random (integer) feature values from set [low, high]
+        :param low: sets lower bound of random feature values
+        :param high: sets high bound of random feature values
         :param seed: sets seed of numpy random
         :return: X, 2D dataset
         """
@@ -45,113 +61,214 @@ def generate_data(self,
                 'cardinality': cardinality,
                 'structure': structure,
                 'ensure_rep': ensure_rep,
-                'seed': seed
-            }
+                'seed': seed,
+            },
         })
 
         np.random.seed(seed)
         X = np.empty([n_features, n_samples])
 
-        if structure == None:
-
+        if structure is None:
+            # No specific structure parameter passed
             for i in range(n_features):
-                x = self._generate_feature(cardinality, n_samples, ensure_rep=ensure_rep)
+                x = self._generate_feature(
+                    n_samples,
+                    cardinality=cardinality,
+                    ensure_rep=ensure_rep,
+                    random_values=random_values,
+                    low=low,
+                    high=high,
+                )
                 X[i] = x
-
         else:
-
+            # Structure parameter passed, building based on structure
             ix = 0
             for data in structure:
-
                 if not isinstance(data[0], (list, np.ndarray)):
-                    feature_ix = data[0]
-                    feature_cardinality = data[1]
+                    # Data in structure is a tuple of (feature index (integer), feature attributes)
+                    feature_ix, feature_attributes = data
 
                     if ix < feature_ix:
+                        # Filling out the dataset up to column index feature_ix
                         for i in range(ix, feature_ix):
-                            x = self._generate_feature(cardinality, n_samples, ensure_rep=ensure_rep)
+                            x = self._generate_feature(
+                                n_samples,
+                                cardinality=cardinality,
+                                ensure_rep=ensure_rep,
+                                random_values=random_values,
+                                low=low,
+                                high=high,
+                            )
                             X[ix] = x
                             ix += 1
 
-                    if not isinstance(feature_cardinality, (list, np.ndarray)):
-                        x = self._generate_feature(feature_cardinality, n_samples, ensure_rep=ensure_rep)
-                    else:
-                        if isinstance(feature_cardinality[0], (list, np.ndarray)):
-                            value_domain = feature_cardinality[0]
-                            value_frequencies = feature_cardinality[1]
-                            x = self._generate_feature(value_domain, n_samples, ensure_rep=ensure_rep, p=value_frequencies)
-                        else:
-                            value_domain = feature_cardinality
-                            x = self._generate_feature(value_domain, n_samples, ensure_rep=ensure_rep)
+                    x = self._feature_builder(
+                        feature_attributes,
+                        n_samples,
+                        ensure_rep=ensure_rep,
+                        random_values=random_values,
+                        low=low,
+                        high=high,
+                    )
                     X[ix] = x
                     ix += 1
 
                 else:
+                    # Data in structure is a tuple of (list of feature indexes, feature attributes)
                     feature_ixs = data[0]
-                    feature_cardinality = data[1]
+                    feature_attributes = data[1]
+
                     for feature_ix in feature_ixs:
+                        # Filling out the dataset up to feature_ix
                         if ix < feature_ix:
                             for i in range(ix, feature_ix):
-                                x = self._generate_feature(cardinality, n_samples, ensure_rep=ensure_rep)
+                                x = self._generate_feature(
+                                    n_samples,
+                                    cardinality=cardinality,
+                                    ensure_rep=ensure_rep,
+                                    random_values=random_values,
+                                    low=low,
+                                    high=high,
+                                )
                                 X[ix] = x
                                 ix += 1
 
-                        if not isinstance(feature_cardinality, (list, np.ndarray)):
-                            x = self._generate_feature(feature_cardinality, n_samples, ensure_rep=ensure_rep)
-                        else:
-                            value_domain = feature_cardinality[0]
-                            value_frequencies = feature_cardinality[1]
-                            x = self._generate_feature(value_domain, n_samples, ensure_rep=ensure_rep, p=value_frequencies)
+                        x = self._feature_builder(
+                            feature_attributes,
+                            n_samples,
+                            ensure_rep=ensure_rep,
+                            random_values=random_values,
+                            low=low,
+                            high=high,
+                        )
+
                         X[ix] = x
                         ix += 1
 
             if ix < n_features:
+                # Fill out the rest of the dataset
                 for i in range(ix, n_features):
-                    x = self._generate_feature(cardinality, n_samples, ensure_rep=ensure_rep)
+                    x = self._generate_feature(
+                        n_samples,
+                        cardinality=cardinality,
+                        ensure_rep=ensure_rep,
+                        random_values=random_values,
+                        low=low,
+                        high=high,
+                    )
                     X[i] = x
 
         return X.T
 
-    def _generate_feature(self,
-                          v: Union[int, List[int], np.ndarray],
-                          size: int,
-                          ensure_rep: bool = False,
-                          p: Optional[Union[List[float], np.ndarray]] = None) -> np.ndarray:
+    def _feature_builder(
+        self,
+        feature_attributes: int | list | np.ndarray,
+        n_samples: int,
+        ensure_rep: bool = False,
+        random_values: bool | None = False,
+        low: int | None = 0,
+        high: int | None = 1000,
+    ) -> np.ndarray:
+
         """
-        Generates feature vector of length size. Default probability density distribution is approx. normal, centred around randomly picked value.
-        :param v: either int for cardinality, or list of values
+        Helper function to avoid duplicate code, builds feature
+        :param feature_attributes: either integer (cardinality) or list of feature attributes
+        :param n_samples: number of samples in dataset
+        :param ensure_rep: ensures all values are represented at least once in the feature vector
+        :param random_values: randomly picked values for vec if true, otherwise values range from [low, cardinality] with by 1
+        :param low: lower bound of random feature vector values
+        :param high: upper bound of random feature vector values
+        :return: feature vector
+        """
+
+        if not isinstance(feature_attributes, (list, np.ndarray)):
+            # feature_cardinality is just an integer, generate feature either with random values or
+            # [low, low+cardinality]
+            x = self._generate_feature(
+                n_samples,
+                cardinality=feature_attributes,
+                ensure_rep=ensure_rep,
+                random_values=random_values,
+                low=low,
+                high=high,
+            )
+        else:
+            # feature_cardinality is a list of [value_domain, value_frequencies]
+            if isinstance(feature_attributes[0], (list, np.ndarray)):
+                value_domain, value_frequencies = feature_attributes
+                x = self._generate_feature(
+                    n_samples,
+                    vec=value_domain,
+                    ensure_rep=ensure_rep,
+                    p=value_frequencies,
+                )
+            else:
+                # feature_cardinality is value_domain (list of values for feature)
+                value_domain = feature_attributes
+                x = self._generate_feature(
+                    n_samples,
+                    vec=value_domain,
+                    ensure_rep=ensure_rep,
+                )
+
+        return x
+
+    def _generate_feature(
+        self,
+        size: int,
+        vec: list[int] | np.ndarray | None = None,
+        cardinality: int = 5,
+        ensure_rep: bool = False,
+        random_values: bool | None = False,
+        low: int | None = 0,
+        high: int | None = 1000,
+        p: list[float] | np.ndarray | None = None,
+    ) -> np.ndarray:
+        """
+        Generates feature vector of length size. Default probability density distribution is approx. normal, centred around a randomly picked value.
+        :param vec: list of feature values
+        :param cardinality: single value cardinality
         :param size: length of feature vector
         :param ensure_rep: ensures all values are represented at least once in the feature vector
+        :param random_values: randomly picked values for vec if true, otherwise values range from [low, cardinality] with by 1
+        :param low: lower bound of random feature vector values
+        :param high: upper bound of random feature vector values
         :param p: list of probabilities of each value
-        :return:
+        :return: feature vector x
         """
-        if not isinstance(v, (list, np.ndarray)):
-            v = np.arange(0, v, 1)
+
+        if vec is None:
+            if random_values:
+                vec = np.random.choice(range(low, high + 1), cardinality, replace=False)
+            else:
+                vec = np.arange(low, low + cardinality, 1)
         else:
-            v = np.array(v)
+            vec = np.array(vec)
 
         if p is None:
-            v_shift = v - v[np.random.randint(len(v))]
+            v_shift = vec - vec[np.random.randint(len(vec))]
             p = norm.pdf(v_shift, scale=3)
         else:
             p = np.array(p)
 
         p = p / p.sum()
 
-        if ensure_rep and len(v) < size:
-            sampled_values = np.random.choice(v, size=(size - len(v)), p=p)
-            sampled_values = np.append(sampled_values, v)
+        if ensure_rep and len(vec) < size:
+            sampled_values = np.random.choice(vec, size=(size - len(vec)), p=p)
+            sampled_values = np.append(sampled_values, vec)
         else:
-            sampled_values = np.random.choice(v, size=size, p=p)
+            sampled_values = np.random.choice(vec, size=size, p=p)
 
         np.random.shuffle(sampled_values)
         return sampled_values
 
-    def generate_combinations(self,
-                              X: np.ndarray,
-                              feature_indices: Union[List[int], np.ndarray],
-                              combination_function: Optional = None,
-                              combination_type: str ='linear') -> np.ndarray:
+    def generate_combinations(
+        self,
+        X: np.ndarray,
+        feature_indices: list[int] | np.ndarray,
+        combination_function: Optional = None,
+        combination_type: str = 'linear',
+    ) -> np.ndarray:
         """
         Generates linear, nonlinear, or custom combinations within feature vectors in given dataset X
         :param X: dataset
@@ -161,7 +278,6 @@ def generate_combinations(self,
         :return: X with added resultant feature
         """
 
-
         selected_features = X[:, feature_indices]
 
         if combination_function is None:
@@ -179,7 +295,7 @@ def generate_combinations(self,
         self.dataset_info['combinations'].append({
             'feature_indices': feature_indices,
             'combination_type': combination_type,
-            'combination_ix': combination_ix
+            'combination_ix': combination_ix,
         })
 
         return np.column_stack((X, combination_result))
@@ -231,10 +347,13 @@ def _or(self, arr):
                 out = np.bitwise_or(out, arrT[i])
 
         return out.T
-    def generate_correlated(self,
-                            X: np.ndarray,
-                            feature_indices: Union[List[int], np.ndarray],
-                            r: float = 0.8) -> np.ndarray:
+
+    def generate_correlated(
+        self,
+        X: np.ndarray,
+        feature_indices: list[int] | np.ndarray,
+        r: float = 0.8,
+    ) -> np.ndarray:
 
         """
         Generates correlated features using the given feature indices. Correlation is based on cosine of angle between vectors with mean 0.
@@ -282,14 +401,16 @@ def generate_correlated(self,
         self.dataset_info['correlations'].append({
             'feature_indices': feature_indices,
             'correlated_indices': correlated_ixs,
-            'correlation_factor': r
+            'correlation_factor': r,
         })
 
         return np.column_stack((X, correlated_features))
 
-    def generate_duplicates(self,
-                            X: np.ndarray,
-                            feature_indices: Union[List[int], np.ndarray]) -> np.ndarray:
+    def generate_duplicates(
+        self,
+        X: np.ndarray,
+        feature_indices: list[int] | np.ndarray,
+    ) -> np.ndarray:
         """
         Generates duplicate features
         :param X: dataset
@@ -305,19 +426,21 @@ def generate_duplicates(self,
 
         self.dataset_info['duplicates'].append({
             'feature_indices': feature_indices,
-            'duplicate_indices': duplicated_ixs
+            'duplicate_indices': duplicated_ixs,
         })
 
         return np.column_stack((X, selected_features))
 
-    def generate_labels(self,
-                        X: np.ndarray,
-                        n: int = 2,
-                        p: Union[float, list[float], np.ndarray] = 0.5,
-                        k: Union[int, float] = 2,
-                        decision_function: Optional = None,
-                        class_relation: str ='linear',
-                        balance: bool = False):
+    def generate_labels(
+        self,
+        X: np.ndarray,
+        n: int = 2,
+        p: float | list[float] | np.ndarray = 0.5,
+        k: int | float = 2,
+        decision_function: Optional = None,
+        class_relation: str = 'linear',
+        balance: bool = False,
+    ):
         """
         Generates labels for dataset X
         :param X: dataset
@@ -397,17 +520,19 @@ def generate_labels(self,
         self.dataset_info.update({
             'labels': {
                 'class_relation': class_relation,
-                'n_class': n
-            }
+                'n_class': n,
+            },
         })
 
         return y
 
-    def _cluster_data(self,
-                      X: np.ndarray,
-                      n: int,
-                      p: Optional[Union[float, List[float], np.ndarray]] = 1.0,
-                      balance: bool = False) -> np.ndarray:
+    def _cluster_data(
+        self,
+        X: np.ndarray,
+        n: int,
+        p: float | list[float] | np.ndarray | None = 1.0,
+        balance: bool = False,
+    ) -> np.ndarray:
         """
         Cluster data using kmeans
         :param X: dataset
@@ -436,7 +561,7 @@ def _cluster_data(self,
                     for val in p:
                         samples_per_cluster.append(int(samples * val))
                 else:
-                    raise Exception("Length of balance parameter must equal number of clusters.")
+                    raise Exception('Length of balance parameter must equal number of clusters.')
 
         # Adjust cluster sizes
         if balance:
@@ -455,15 +580,19 @@ def _cluster_data(self,
                     dataset_indices = np.where(cluster_labels == i)[0]  # Indices of samples in dataset
                     cluster_samples = np.copy(X[dataset_indices])
 
-                    distances = np.linalg.norm(cluster_samples - centroid,
-                                               axis=1)  # Distances of cluster samples to cluster centroid
+                    distances = np.linalg.norm(
+                        cluster_samples - centroid,
+                        axis=1,
+                    )  # Distances of cluster samples to cluster centroid
                     cluster_sample_indices = np.argsort(distances)
                     dataset_indices_sorted = dataset_indices[
-                        cluster_sample_indices]  # Indices of samples sorted by sample distance to cluster centroid
+                        cluster_sample_indices
+                    ]  # Indices of samples sorted by sample distance to cluster centroid
 
                     overflow_sample_indices = cluster_sample_indices[samples_per_cluster[i]:]  # Overflow samples
                     dataset_indices_sorted = dataset_indices_sorted[
-                                             samples_per_cluster[i]:]  # Dataset indices of overflow samples
+                                             samples_per_cluster[i]:
+                    ]  # Dataset indices of overflow samples
 
                     for i in range(len(overflow_sample_indices)):
                         overflow_samples.append(cluster_samples[overflow_sample_indices[i]])
@@ -493,12 +622,14 @@ def _cluster_data(self,
 
         return np.array(cluster_labels)
 
-    def generate_noise(self,
-                       X: np.ndarray,
-                       y: Union[List[int], np.ndarray],
-                       p: float = 0.2,
-                       type: str = "categorical",
-                       missing_val: Union[str, int, float] = float('-inf')) -> np.ndarray:
+    def generate_noise(
+        self,
+        X: np.ndarray,
+        y: list[int] | np.ndarray,
+        p: float = 0.2,
+        type: str = 'categorical',
+        missing_val: str | int | float = float('-inf'),
+    ) -> np.ndarray:
 
         """
         Simulates noise on given dataset X
@@ -512,10 +643,10 @@ def generate_noise(self,
 
         self.dataset_info['noise'].append({
             'type': type,
-            'amount': p
+            'amount': p,
         })
 
-        if type == "categorical":
+        if type == 'categorical':
             label_values, label_count = np.unique(y, return_counts=True)
             n_labels = len(label_values)
 
@@ -570,7 +701,7 @@ def generate_noise(self,
 
             return X_noise
 
-        elif type == "missing":
+        elif type == 'missing':
             X_noise = np.copy(X)
             Xn_T = X_noise.T
             n = Xn_T.shape[1]
@@ -585,12 +716,14 @@ def generate_noise(self,
 
             return Xn_T.T
 
-    def downsample_dataset(self,
-                           X: np.array,
-                           y: Union[List[int], np.ndarray],
-                           N: Optional[Union[int, None]] = None,
-                           seed: int = 42,
-                           reshuffle: bool=False) -> Tuple[np.array, np.ndarray]:
+    def downsample_dataset(
+        self,
+        X: np.array,
+        y: list[int] | np.ndarray,
+        N: int | None | None = None,
+        seed: int = 42,
+        reshuffle: bool = False,
+    ) -> tuple[np.array, np.ndarray]:
 
         """
         Downsamples dataset X according to N or the number of samples in minority class, resulting in a balanced dataset.
@@ -609,16 +742,18 @@ def downsample_dataset(self,
             N = min(counts)
 
         if N > min(counts):
-            raise ValueError("N must be equal to or less than the number of samples in minority class")
+            raise ValueError('N must be equal to or less than the number of samples in minority class')
 
         X_arrays_list = []
         y_downsampled = []
         for label in values:
             X_label = [X[i] for i in range(len(y)) if y[i] == label]
-            X_label_downsample = resample(X_label,
-                                          replace=True,
-                                          n_samples=N,
-                                          random_state=seed)
+            X_label_downsample = resample(
+                X_label,
+                replace=True,
+                n_samples=N,
+                random_state=seed,
+            )
             X_arrays_list.append(X_label_downsample)
             ys = [label] * N
             y_downsampled = np.concatenate((y_downsampled, ys), axis=0)
@@ -636,8 +771,8 @@ def downsample_dataset(self,
         self.dataset_info.update({
             'downsampling': {
                 'original_shape': original_shape,
-                'downsampled_shape': downsampled_shape
-            }
+                'downsampled_shape': downsampled_shape,
+            },
         })
 
         return X_downsampled, y_downsampled
@@ -659,44 +794,50 @@ def print_dataset(self, X, y):
                     print(arr[i], end='')
                 else:
                     print(arr[i], end=', ')
-            print("], Label: {}".format(y[n]))
+            print(f'], Label: {y[n]}')
             n += 1
 
-
     def summarize(self):
 
         print(f"Number of features: {self.dataset_info['general']['n_features']}")
         print(f"Number of generated samples: {self.dataset_info['general']['n_samples']}")
         if self.dataset_info['downsampling']:
-            print(f"Dataset downsampled from shape {self.dataset_info['downsampling']['original_shape']},to shape {self.dataset_info['downsampling']['downsampled_shape']}")
+            print(
+                f"Dataset downsampled from shape {self.dataset_info['downsampling']['original_shape']},to shape {self.dataset_info['downsampling']['downsampled_shape']}",
+            )
         print(f"Number of classes: {self.dataset_info['labels']['n_class']}")
         print(f"Class relation: {self.dataset_info['labels']['class_relation']}")
 
-
         print('-------------------------------------')
 
         if len(self.dataset_info['combinations']) > 0:
-            print("Combinations:")
+            print('Combinations:')
             for comb in self.dataset_info['combinations']:
-                print(f"Features {comb['feature_indices']} are in {comb['combination_type']} combination, result in {comb['combination_ix']}")
+                print(
+                    f"Features {comb['feature_indices']} are in {comb['combination_type']} combination, result in {comb['combination_ix']}",
+                )
             print('-------------------------------------')
 
         if len(self.dataset_info['correlations']) > 0:
-            print("Correlations:")
+            print('Correlations:')
             for corr in self.dataset_info['correlations']:
-                print(f"Features {corr['feature_indices']} are correlated to {corr['correlated_indices']} with a factor of {corr['correlation_factor']}")
+                print(
+                    f"Features {corr['feature_indices']} are correlated to {corr['correlated_indices']} with a factor of {corr['correlation_factor']}",
+                )
             print('-------------------------------------')
 
         if len(self.dataset_info['duplicates']) > 0:
-            print("Duplicates:")
+            print('Duplicates:')
             for dup in self.dataset_info['duplicates']:
-                print(f"Features {dup['feature_indices']} are duplicated, duplicate indexes are {dup['duplicate_indices']}")
+                print(
+                    f"Features {dup['feature_indices']} are duplicated, duplicate indexes are {dup['duplicate_indices']}",
+                )
             print('-------------------------------------')
 
         if len(self.dataset_info['noise']) > 0:
-            print("Simulated noise:")
+            print('Simulated noise:')
             for noise in self.dataset_info['noise']:
                 print(f"Simulated {noise['type']} noise, amount of {noise['noise_amount']}")
             print('-------------------------------------')
 
-        print("\nFor more information on dataset structure, print cc.dataset_info['general']['structure']")
\ No newline at end of file
+        print("\nFor more information on dataset structure, print cc.dataset_info['general']['structure']")
diff --git a/tests/cc_generator_tests.py b/tests/cc_generator_tests.py
index e5665f6..46ca8c4 100644
--- a/tests/cc_generator_tests.py
+++ b/tests/cc_generator_tests.py
@@ -1,6 +1,9 @@
-import pytest
+from __future__ import annotations
+
 import numpy as np
+import pytest
 from scipy.stats import pearsonr
+
 from outrank.algorithms.synthetic_data_generators.cc_generator import CategoricalClassification
 
 @pytest.fixture
@@ -12,15 +15,15 @@ def test_init(cc_instance):
 
 def test_generate_data_shape_and_type(cc_instance):
     X = cc_instance.generate_data(n_features=5, n_samples=100)
-    assert isinstance(X, np.ndarray), "Output should be a numpy array"
-    assert X.shape == (100, 5), "Shape should be (n_samples, n_features)"
+    assert isinstance(X, np.ndarray), 'Output should be a numpy array'
+    assert X.shape == (100, 5), 'Shape should be (n_samples, n_features)'
 
 def test_generate_data_cardinality(cc_instance):
     n_features = 5
     cardinality = 3
     X = cc_instance.generate_data(n_features=n_features, n_samples=100, cardinality=cardinality)
     unique_values = np.unique(X)
-    assert len(unique_values) <= cardinality, "Cardinality not respected for all features"
+    assert len(unique_values) <= cardinality, 'Cardinality not respected for all features'
 
 def test_generate_data_ensure_rep(cc_instance):
     n_features = 5
@@ -30,35 +33,35 @@ def test_generate_data_ensure_rep(cc_instance):
     assert len(unique_values) == cardinality, "Not all values represented when 'ensure_rep=True'"
 
 def test_generate_feature_shape_and_type(cc_instance):
-    feature = cc_instance._generate_feature(5, size=100)
-    assert isinstance(feature, np.ndarray), "Output should be a numpy array"
-    assert feature.shape == (100,), "Shape should be (size,)"
+    feature = cc_instance._generate_feature(100, cardinality=5)
+    assert isinstance(feature, np.ndarray), 'Output should be a numpy array'
+    assert feature.shape == (100,), 'Shape should be (size,)'
 
 def test_generate_feature_cardinality(cc_instance):
-    feature = cc_instance._generate_feature(5, size=100)
+    feature = cc_instance._generate_feature(100, cardinality=5)
     unique_values = np.unique(feature)
-    assert len(unique_values) <= 5, "Feature cardinality not respected for all features"
+    assert len(unique_values) <= 5, 'Feature cardinality not respected for all features'
 
 def test_generate_feature_ensure_rep(cc_instance):
-    feature = cc_instance._generate_feature(50, size=100, ensure_rep=True)
+    feature = cc_instance._generate_feature(100, cardinality=50, ensure_rep=True)
     unique_values = np.unique(feature)
     assert len(unique_values) == 50, "Not all values represented when using 'ensure_rep=True'"
 
 def test_generate_feature_values(cc_instance):
     values = [5, 6, 7, 8, 9, 10]
-    feature = cc_instance._generate_feature(values, size=100)
+    feature = cc_instance._generate_feature(100, vec=values)
     unique_values = np.unique(feature)
-    assert any(f in feature for f in values), "Feature values not in input list"
+    assert any(f in feature for f in values), 'Feature values not in input list'
 def test_generate_feature_values_ensure_rep(cc_instance):
     values = [5, 6, 7, 8, 9, 10]
-    feature = cc_instance._generate_feature(values, size=100, ensure_rep=True)
+    feature = cc_instance._generate_feature(100, vec=values, ensure_rep=True)
     unique_values = np.unique(feature)
     assert (values == unique_values).all(), "Feature values should match input list when 'ensure_rep=True'"
 
 def test_generate_feature_density(cc_instance):
     values = [0, 1, 2]
     p = [0.2, 0.4, 0.4]
-    feature = cc_instance._generate_feature(values, size=10000, ensure_rep=True, p=p)
+    feature = cc_instance._generate_feature(10000, vec=values, ensure_rep=True, p=p)
     values, counts = np.unique(feature, return_counts=True)
     generated_p = np.round(counts/10000, decimals=1)
     assert (generated_p == p).all(), "Feature values should have density roughly equal to 'p'"
@@ -67,15 +70,15 @@ def test_generate_combinations_shape_and_type(cc_instance):
     X = cc_instance.generate_data(n_features=5, n_samples=100)
     indices = [0,1]
     X = cc_instance.generate_combinations(X, indices, combination_type='linear')
-    assert isinstance(X, np.ndarray), "Output should be a numpy array"
-    assert X.shape == (100, 6), "Shape should be (n_samples, n_features + 1)"
+    assert isinstance(X, np.ndarray), 'Output should be a numpy array'
+    assert X.shape == (100, 6), 'Shape should be (n_samples, n_features + 1)'
 
 def test_generate_correlated_shape_and_type(cc_instance):
     X = cc_instance.generate_data(n_features=5, n_samples=100)
     indices = 0
     X = cc_instance.generate_correlated(X, indices, r=0.8)
-    assert isinstance(X, np.ndarray), "Output should be a numpy array"
-    assert X.shape == (100, 6), "Shape should be (n_samples, n_features + 1)"
+    assert isinstance(X, np.ndarray), 'Output should be a numpy array'
+    assert X.shape == (100, 6), 'Shape should be (n_samples, n_features + 1)'
 
 def test_generate_correlated_correlaton(cc_instance):
     X = cc_instance.generate_data(n_features=5, n_samples=100)
@@ -90,8 +93,8 @@ def test_generate_duplicates_shape_and_type(cc_instance):
     X = cc_instance.generate_data(n_features=5, n_samples=100)
     indices = 0
     X = cc_instance.generate_duplicates(X, indices)
-    assert isinstance(X, np.ndarray), "Output should be a numpy array"
-    assert X.shape == (100, 6), "Shape should be (n_samples, n_features + 1)"
+    assert isinstance(X, np.ndarray), 'Output should be a numpy array'
+    assert X.shape == (100, 6), 'Shape should be (n_samples, n_features + 1)'
 
 def test_generate_duplicates_duplication(cc_instance):
     X = cc_instance.generate_data(n_features=5, n_samples=100)
@@ -106,7 +109,7 @@ def test_xor_operation(cc_instance):
     arr = [a, b]
     result = cc_instance._xor(arr)
     expected = np.array([1, 1, 0])
-    assert np.array_equal(result, expected), "XOR operation did not produce expected result"
+    assert np.array_equal(result, expected), 'XOR operation did not produce expected result'
 
 def test_and_operation(cc_instance):
     a = np.array([1, 0, 1])
@@ -114,7 +117,7 @@ def test_and_operation(cc_instance):
     arr = [a, b]
     result = cc_instance._and(arr)
     expected = np.array([0, 0, 1])
-    assert np.array_equal(result, expected), "AND operation did not produce expected result"
+    assert np.array_equal(result, expected), 'AND operation did not produce expected result'
 
 def test_or_operation(cc_instance):
     a = np.array([1, 0, 1])
@@ -122,13 +125,13 @@ def test_or_operation(cc_instance):
     arr = [a, b]
     result = cc_instance._or(arr)
     expected = np.array([1, 1, 1])
-    assert np.array_equal(result, expected), "OR operation did not produce expected result"
+    assert np.array_equal(result, expected), 'OR operation did not produce expected result'
 
 def test_generate_labels_shape_and_type(cc_instance):
     X = cc_instance.generate_data(n_features=5, n_samples=100)
     labels = cc_instance.generate_labels(X)
-    assert isinstance(labels, np.ndarray), "Output should be a numpy array"
-    assert labels.shape == (100,), "Shape should be (n_samples,)"
+    assert isinstance(labels, np.ndarray), 'Output should be a numpy array'
+    assert labels.shape == (100,), 'Shape should be (n_samples,)'
 
 def test_generate_labels_distribution(cc_instance):
     X = cc_instance.generate_data(n_features=5, n_samples=100)
@@ -136,22 +139,22 @@ def test_generate_labels_distribution(cc_instance):
     unique, counts = np.unique(labels, return_counts=True)
     distribution = counts / 100
     expected_distribution = np.array([0.2, 0.3, 0.5])
-    assert np.allclose(distribution, expected_distribution, atol=0.1), "Label distribution does not match expected distribution"
+    assert np.allclose(distribution, expected_distribution, atol=0.1), 'Label distribution does not match expected distribution'
 
 def test_generate_labels_class_relation_linear(cc_instance):
     X = cc_instance.generate_data(n_features=5, n_samples=100)
     labels = cc_instance.generate_labels(X, class_relation='linear')
-    assert isinstance(labels, np.ndarray), "Output should be a numpy array"
-    assert labels.shape == (100,), "Shape should be (n_samples,)"
+    assert isinstance(labels, np.ndarray), 'Output should be a numpy array'
+    assert labels.shape == (100,), 'Shape should be (n_samples,)'
 
 def test_generate_labels_class_relation_nonlinear(cc_instance):
     X = cc_instance.generate_data(n_features=5, n_samples=100)
     labels = cc_instance.generate_labels(X, class_relation='nonlinear')
-    assert isinstance(labels, np.ndarray), "Output should be a numpy array"
-    assert labels.shape == (100,), "Shape should be (n_samples,)"
+    assert isinstance(labels, np.ndarray), 'Output should be a numpy array'
+    assert labels.shape == (100,), 'Shape should be (n_samples,)'
 
 def test_generate_labels_class_relation_cluster(cc_instance):
     X = cc_instance.generate_data(n_features=5, n_samples=100)
     labels = cc_instance.generate_labels(X, class_relation='cluster', balance=True)
-    assert isinstance(labels, np.ndarray), "Output should be a numpy array"
-    assert labels.shape == (100,), "Shape should be (n_samples,)"
\ No newline at end of file
+    assert isinstance(labels, np.ndarray), 'Output should be a numpy array'
+    assert labels.shape == (100,), 'Shape should be (n_samples,)'

From d0d50976eb6116e1efb6f0a8519cf5da52b11925 Mon Sep 17 00:00:00 2001
From: 98MM <47939788+98MM@users.noreply.github.com>
Date: Tue, 9 Jul 2024 10:22:59 +0200
Subject: [PATCH 4/9] Rewrote tests with unittest instead of pytest

---
 tests/cc_generator_tests.py | 311 ++++++++++++++++++------------------
 1 file changed, 158 insertions(+), 153 deletions(-)

diff --git a/tests/cc_generator_tests.py b/tests/cc_generator_tests.py
index 46ca8c4..16cb7b2 100644
--- a/tests/cc_generator_tests.py
+++ b/tests/cc_generator_tests.py
@@ -1,160 +1,165 @@
 from __future__ import annotations
 
+import unittest
+
 import numpy as np
-import pytest
 from scipy.stats import pearsonr
 
 from outrank.algorithms.synthetic_data_generators.cc_generator import CategoricalClassification
 
-@pytest.fixture
-def cc_instance():
-    return CategoricalClassification()
-
-def test_init(cc_instance):
-    assert cc_instance.dataset_info == ''
-
-def test_generate_data_shape_and_type(cc_instance):
-    X = cc_instance.generate_data(n_features=5, n_samples=100)
-    assert isinstance(X, np.ndarray), 'Output should be a numpy array'
-    assert X.shape == (100, 5), 'Shape should be (n_samples, n_features)'
-
-def test_generate_data_cardinality(cc_instance):
-    n_features = 5
-    cardinality = 3
-    X = cc_instance.generate_data(n_features=n_features, n_samples=100, cardinality=cardinality)
-    unique_values = np.unique(X)
-    assert len(unique_values) <= cardinality, 'Cardinality not respected for all features'
-
-def test_generate_data_ensure_rep(cc_instance):
-    n_features = 5
-    cardinality = 50
-    X = cc_instance.generate_data(n_features=n_features, n_samples=100, cardinality=cardinality, ensure_rep=True)
-    unique_values = np.unique(X)
-    assert len(unique_values) == cardinality, "Not all values represented when 'ensure_rep=True'"
-
-def test_generate_feature_shape_and_type(cc_instance):
-    feature = cc_instance._generate_feature(100, cardinality=5)
-    assert isinstance(feature, np.ndarray), 'Output should be a numpy array'
-    assert feature.shape == (100,), 'Shape should be (size,)'
-
-def test_generate_feature_cardinality(cc_instance):
-    feature = cc_instance._generate_feature(100, cardinality=5)
-    unique_values = np.unique(feature)
-    assert len(unique_values) <= 5, 'Feature cardinality not respected for all features'
-
-def test_generate_feature_ensure_rep(cc_instance):
-    feature = cc_instance._generate_feature(100, cardinality=50, ensure_rep=True)
-    unique_values = np.unique(feature)
-    assert len(unique_values) == 50, "Not all values represented when using 'ensure_rep=True'"
-
-def test_generate_feature_values(cc_instance):
-    values = [5, 6, 7, 8, 9, 10]
-    feature = cc_instance._generate_feature(100, vec=values)
-    unique_values = np.unique(feature)
-    assert any(f in feature for f in values), 'Feature values not in input list'
-def test_generate_feature_values_ensure_rep(cc_instance):
-    values = [5, 6, 7, 8, 9, 10]
-    feature = cc_instance._generate_feature(100, vec=values, ensure_rep=True)
-    unique_values = np.unique(feature)
-    assert (values == unique_values).all(), "Feature values should match input list when 'ensure_rep=True'"
-
-def test_generate_feature_density(cc_instance):
-    values = [0, 1, 2]
-    p = [0.2, 0.4, 0.4]
-    feature = cc_instance._generate_feature(10000, vec=values, ensure_rep=True, p=p)
-    values, counts = np.unique(feature, return_counts=True)
-    generated_p = np.round(counts/10000, decimals=1)
-    assert (generated_p == p).all(), "Feature values should have density roughly equal to 'p'"
-
-def test_generate_combinations_shape_and_type(cc_instance):
-    X = cc_instance.generate_data(n_features=5, n_samples=100)
-    indices = [0,1]
-    X = cc_instance.generate_combinations(X, indices, combination_type='linear')
-    assert isinstance(X, np.ndarray), 'Output should be a numpy array'
-    assert X.shape == (100, 6), 'Shape should be (n_samples, n_features + 1)'
-
-def test_generate_correlated_shape_and_type(cc_instance):
-    X = cc_instance.generate_data(n_features=5, n_samples=100)
-    indices = 0
-    X = cc_instance.generate_correlated(X, indices, r=0.8)
-    assert isinstance(X, np.ndarray), 'Output should be a numpy array'
-    assert X.shape == (100, 6), 'Shape should be (n_samples, n_features + 1)'
-
-def test_generate_correlated_correlaton(cc_instance):
-    X = cc_instance.generate_data(n_features=5, n_samples=100)
-    indices = 0
-    X = cc_instance.generate_correlated(X, indices, r=0.8)
-    Xt = X.T
-    corr, _ = pearsonr(Xt[0], Xt[5])
-    assert np.round(corr, decimals=1) == 0.8, "Resultant correlation should be equal to the 'r' parameter"
-
-
-def test_generate_duplicates_shape_and_type(cc_instance):
-    X = cc_instance.generate_data(n_features=5, n_samples=100)
-    indices = 0
-    X = cc_instance.generate_duplicates(X, indices)
-    assert isinstance(X, np.ndarray), 'Output should be a numpy array'
-    assert X.shape == (100, 6), 'Shape should be (n_samples, n_features + 1)'
-
-def test_generate_duplicates_duplication(cc_instance):
-    X = cc_instance.generate_data(n_features=5, n_samples=100)
-    indices = 0
-    X = cc_instance.generate_duplicates(X, indices)
-    Xt = X.T
-    assert (Xt[0] == Xt[-1]).all()
-
-def test_xor_operation(cc_instance):
-    a = np.array([1, 0, 1])
-    b = np.array([0, 1, 1])
-    arr = [a, b]
-    result = cc_instance._xor(arr)
-    expected = np.array([1, 1, 0])
-    assert np.array_equal(result, expected), 'XOR operation did not produce expected result'
-
-def test_and_operation(cc_instance):
-    a = np.array([1, 0, 1])
-    b = np.array([0, 1, 1])
-    arr = [a, b]
-    result = cc_instance._and(arr)
-    expected = np.array([0, 0, 1])
-    assert np.array_equal(result, expected), 'AND operation did not produce expected result'
-
-def test_or_operation(cc_instance):
-    a = np.array([1, 0, 1])
-    b = np.array([0, 1, 1])
-    arr = [a, b]
-    result = cc_instance._or(arr)
-    expected = np.array([1, 1, 1])
-    assert np.array_equal(result, expected), 'OR operation did not produce expected result'
-
-def test_generate_labels_shape_and_type(cc_instance):
-    X = cc_instance.generate_data(n_features=5, n_samples=100)
-    labels = cc_instance.generate_labels(X)
-    assert isinstance(labels, np.ndarray), 'Output should be a numpy array'
-    assert labels.shape == (100,), 'Shape should be (n_samples,)'
-
-def test_generate_labels_distribution(cc_instance):
-    X = cc_instance.generate_data(n_features=5, n_samples=100)
-    labels = cc_instance.generate_labels(X, n=3, p=[0.2, 0.3, 0.5])
-    unique, counts = np.unique(labels, return_counts=True)
-    distribution = counts / 100
-    expected_distribution = np.array([0.2, 0.3, 0.5])
-    assert np.allclose(distribution, expected_distribution, atol=0.1), 'Label distribution does not match expected distribution'
-
-def test_generate_labels_class_relation_linear(cc_instance):
-    X = cc_instance.generate_data(n_features=5, n_samples=100)
-    labels = cc_instance.generate_labels(X, class_relation='linear')
-    assert isinstance(labels, np.ndarray), 'Output should be a numpy array'
-    assert labels.shape == (100,), 'Shape should be (n_samples,)'
-
-def test_generate_labels_class_relation_nonlinear(cc_instance):
-    X = cc_instance.generate_data(n_features=5, n_samples=100)
-    labels = cc_instance.generate_labels(X, class_relation='nonlinear')
-    assert isinstance(labels, np.ndarray), 'Output should be a numpy array'
-    assert labels.shape == (100,), 'Shape should be (n_samples,)'
-
-def test_generate_labels_class_relation_cluster(cc_instance):
-    X = cc_instance.generate_data(n_features=5, n_samples=100)
-    labels = cc_instance.generate_labels(X, class_relation='cluster', balance=True)
-    assert isinstance(labels, np.ndarray), 'Output should be a numpy array'
-    assert labels.shape == (100,), 'Shape should be (n_samples,)'
+class TestCategoricalClassification(unittest.TestCase):
+
+    def setUp(self):
+        self.cc_instance = CategoricalClassification()
+
+    def test_init(self):
+        self.assertEqual(self.cc_instance.dataset_info, '')
+
+    def test_generate_data_shape_and_type(self):
+        X = self.cc_instance.generate_data(n_features=5, n_samples=100)
+        self.assertIsInstance(X, np.ndarray, 'Output should be a numpy array')
+        self.assertEqual(X.shape, (100, 5), 'Shape should be (n_samples, n_features)')
+
+    def test_generate_data_cardinality(self):
+        n_features = 5
+        cardinality = 3
+        X = self.cc_instance.generate_data(n_features=n_features, n_samples=100, cardinality=cardinality)
+        unique_values = np.unique(X)
+        self.assertLessEqual(len(unique_values), cardinality, 'Cardinality not respected for all features')
+
+    def test_generate_data_ensure_rep(self):
+        n_features = 5
+        cardinality = 50
+        X = self.cc_instance.generate_data(n_features=n_features, n_samples=100, cardinality=cardinality, ensure_rep=True)
+        unique_values = np.unique(X)
+        self.assertEqual(len(unique_values), cardinality, "Not all values represented when 'ensure_rep=True'")
+
+    def test_generate_feature_shape_and_type(self):
+        feature = self.cc_instance._generate_feature(100, cardinality=5)
+        self.assertIsInstance(feature, np.ndarray, 'Output should be a numpy array')
+        self.assertEqual(feature.shape, (100,), 'Shape should be (size,)')
+
+    def test_generate_feature_cardinality(self):
+        feature = self.cc_instance._generate_feature(100, cardinality=5)
+        unique_values = np.unique(feature)
+        self.assertLessEqual(len(unique_values), 5, 'Feature cardinality not respected for all features')
+
+    def test_generate_feature_ensure_rep(self):
+        feature = self.cc_instance._generate_feature(100, cardinality=50, ensure_rep=True)
+        unique_values = np.unique(feature)
+        self.assertEqual(len(unique_values), 50, "Not all values represented when using 'ensure_rep=True'")
+
+    def test_generate_feature_values(self):
+        values = [5, 6, 7, 8, 9, 10]
+        feature = self.cc_instance._generate_feature(100, vec=values)
+        unique_values = np.unique(feature)
+        self.assertTrue(any(f in feature for f in values), 'Feature values not in input list')
+
+    def test_generate_feature_values_ensure_rep(self):
+        values = [5, 6, 7, 8, 9, 10]
+        feature = self.cc_instance._generate_feature(100, vec=values, ensure_rep=True)
+        unique_values = np.unique(feature)
+        self.assertTrue(np.array_equal(values, unique_values), "Feature values should match input list when 'ensure_rep=True'")
+
+    def test_generate_feature_density(self):
+        values = [0, 1, 2]
+        p = [0.2, 0.4, 0.4]
+        feature = self.cc_instance._generate_feature(10000, vec=values, ensure_rep=True, p=p)
+        values, counts = np.unique(feature, return_counts=True)
+        generated_p = np.round(counts/10000, decimals=1)
+        self.assertTrue(np.array_equal(generated_p, p), "Feature values should have density roughly equal to 'p'")
+
+    def test_generate_combinations_shape_and_type(self):
+        X = self.cc_instance.generate_data(n_features=5, n_samples=100)
+        indices = [0,1]
+        X = self.cc_instance.generate_combinations(X, indices, combination_type='linear')
+        self.assertIsInstance(X, np.ndarray, 'Output should be a numpy array')
+        self.assertEqual(X.shape, (100, 6), 'Shape should be (n_samples, n_features + 1)')
+
+    def test_generate_correlated_shape_and_type(self):
+        X = self.cc_instance.generate_data(n_features=5, n_samples=100)
+        indices = 0
+        X = self.cc_instance.generate_correlated(X, indices, r=0.8)
+        self.assertIsInstance(X, np.ndarray, 'Output should be a numpy array')
+        self.assertEqual(X.shape, (100, 6), 'Shape should be (n_samples, n_features + 1)')
+
+    def test_generate_correlated_correlaton(self):
+        X = self.cc_instance.generate_data(n_features=5, n_samples=100)
+        indices = 0
+        X = self.cc_instance.generate_correlated(X, indices, r=0.8)
+        Xt = X.T
+        corr, _ = pearsonr(Xt[0], Xt[5])
+        self.assertAlmostEqual(np.round(corr, decimals=1), 0.8, "Resultant correlation should be equal to the 'r' parameter")
+
+    def test_generate_duplicates_shape_and_type(self):
+        X = self.cc_instance.generate_data(n_features=5, n_samples=100)
+        indices = 0
+        X = self.cc_instance.generate_duplicates(X, indices)
+        self.assertIsInstance(X, np.ndarray, 'Output should be a numpy array')
+        self.assertEqual(X.shape, (100, 6), 'Shape should be (n_samples, n_features + 1)')
+
+    def test_generate_duplicates_duplication(self):
+        X = self.cc_instance.generate_data(n_features=5, n_samples=100)
+        indices = 0
+        X = self.cc_instance.generate_duplicates(X, indices)
+        Xt = X.T
+        self.assertTrue((Xt[0] == Xt[-1]).all())
+
+    def test_xor_operation(self):
+        a = np.array([1, 0, 1])
+        b = np.array([0, 1, 1])
+        arr = [a, b]
+        result = self.cc_instance._xor(arr)
+        expected = np.array([1, 1, 0])
+        self.assertTrue(np.array_equal(result, expected), 'XOR operation did not produce expected result')
+
+    def test_and_operation(self):
+        a = np.array([1, 0, 1])
+        b = np.array([0, 1, 1])
+        arr = [a, b]
+        result = self.cc_instance._and(arr)
+        expected = np.array([0, 0, 1])
+        self.assertTrue(np.array_equal(result, expected), 'AND operation did not produce expected result')
+
+    def test_or_operation(self):
+        a = np.array([1, 0, 1])
+        b = np.array([0, 1, 1])
+        arr = [a, b]
+        result = self.cc_instance._or(arr)
+        expected = np.array([1, 1, 1])
+        self.assertTrue(np.array_equal(result, expected), 'OR operation did not produce expected result')
+
+    def test_generate_labels_shape_and_type(self):
+        X = self.cc_instance.generate_data(n_features=5, n_samples=100)
+        labels = self.cc_instance.generate_labels(X)
+        self.assertIsInstance(labels, np.ndarray, 'Output should be a numpy array')
+        self.assertEqual(labels.shape, (100,), 'Shape should be (n_samples,)')
+
+    def test_generate_labels_distribution(self):
+        X = self.cc_instance.generate_data(n_features=5, n_samples=100)
+        labels = self.cc_instance.generate_labels(X, n=3, p=[0.2, 0.3, 0.5])
+        unique, counts = np.unique(labels, return_counts=True)
+        distribution = counts / 100
+        expected_distribution = np.array([0.2, 0.3, 0.5])
+        self.assertTrue(np.allclose(distribution, expected_distribution, atol=0.1), 'Label distribution does not match expected distribution')
+
+    def test_generate_labels_class_relation_linear(self):
+        X = self.cc_instance.generate_data(n_features=5, n_samples=100)
+        labels = self.cc_instance.generate_labels(X, class_relation='linear')
+        self.assertIsInstance(labels, np.ndarray, 'Output should be a numpy array')
+        self.assertEqual(labels.shape, (100,), 'Shape should be (n_samples,)')
+
+    def test_generate_labels_class_relation_nonlinear(self):
+        X = self.cc_instance.generate_data(n_features=5, n_samples=100)
+        labels = self.cc_instance.generate_labels(X, class_relation='nonlinear')
+        self.assertIsInstance(labels, np.ndarray, 'Output should be a numpy array')
+        self.assertEqual(labels.shape, (100,), 'Shape should be (n_samples,)')
+
+    def test_generate_labels_class_relation_cluster(self):
+        X = self.cc_instance.generate_data(n_features=5, n_samples=100)
+        labels = self.cc_instance.generate_labels(X, class_relation='cluster', balance=True)
+        self.assertIsInstance(labels, np.ndarray, 'Output should be a numpy array')
+        self.assertEqual(labels.shape, (100,), 'Shape should be (n_samples,)')
+
+if __name__ == '__main__':
+    unittest.main()

From 79eb4de39200efc1548411ed0a0d6921eb5404f5 Mon Sep 17 00:00:00 2001
From: 98MM <47939788+98MM@users.noreply.github.com>
Date: Tue, 9 Jul 2024 10:43:40 +0200
Subject: [PATCH 5/9] removed if __name__ == '__main__' from file, small fix in
 cluster test

---
 tests/cc_generator_tests.py | 7 ++-----
 1 file changed, 2 insertions(+), 5 deletions(-)

diff --git a/tests/cc_generator_tests.py b/tests/cc_generator_tests.py
index 16cb7b2..860b079 100644
--- a/tests/cc_generator_tests.py
+++ b/tests/cc_generator_tests.py
@@ -157,9 +157,6 @@ def test_generate_labels_class_relation_nonlinear(self):
 
     def test_generate_labels_class_relation_cluster(self):
         X = self.cc_instance.generate_data(n_features=5, n_samples=100)
-        labels = self.cc_instance.generate_labels(X, class_relation='cluster', balance=True)
+        labels = self.cc_instance.generate_labels(X, class_relation='cluster')
         self.assertIsInstance(labels, np.ndarray, 'Output should be a numpy array')
-        self.assertEqual(labels.shape, (100,), 'Shape should be (n_samples,)')
-
-if __name__ == '__main__':
-    unittest.main()
+        self.assertEqual(labels.shape, (100,), 'Shape should be (n_samples,)')
\ No newline at end of file

From 1e50ee70541fdefb42999d9bbf873a67fa4b302c Mon Sep 17 00:00:00 2001
From: 98MM <47939788+98MM@users.noreply.github.com>
Date: Thu, 11 Jul 2024 20:10:08 +0200
Subject: [PATCH 6/9] code review fixes

renamed _feature_builder -> _configure_generate_featuer

Replace np.ndarray typing with ArrayLike from numpy typing, other typing fixes
---
 .../synthetic_data_generators/cc_generator.py | 82 ++++++++++---------
 tests/cc_generator_tests.py                   |  2 +-
 2 files changed, 43 insertions(+), 41 deletions(-)

diff --git a/outrank/algorithms/synthetic_data_generators/cc_generator.py b/outrank/algorithms/synthetic_data_generators/cc_generator.py
index dd148a5..f370580 100644
--- a/outrank/algorithms/synthetic_data_generators/cc_generator.py
+++ b/outrank/algorithms/synthetic_data_generators/cc_generator.py
@@ -1,11 +1,13 @@
 from __future__ import annotations
 
 from typing import List
+from typing import Literal
 from typing import Optional
 from typing import Tuple
 from typing import Union
 
 import numpy as np
+from numpy.typing import ArrayLike
 from scipy.linalg import qr
 from scipy.stats import norm
 from sklearn.cluster import KMeans
@@ -32,7 +34,7 @@ def generate_data(
         n_features: int,
         n_samples: int,
         cardinality: int = 5,
-        structure: list | np.ndarray | None = None,
+        structure: list | ArrayLike | None = None,
         ensure_rep: bool = False,
         random_values: bool | None = False,
         low: int | None = 0,
@@ -41,7 +43,7 @@ def generate_data(
     ) -> np.ndarray:
 
         """
-        Generates dataset based on parameters
+        Generates dataset based on given parameters
         :param n_features: number of generated features
         :param n_samples: number of generated samples
         :param cardinality: default cardinality of the dataset
@@ -102,7 +104,7 @@ def generate_data(
                             X[ix] = x
                             ix += 1
 
-                    x = self._feature_builder(
+                    x = self._configure_generate_feature(
                         feature_attributes,
                         n_samples,
                         ensure_rep=ensure_rep,
@@ -115,8 +117,7 @@ def generate_data(
 
                 else:
                     # Data in structure is a tuple of (list of feature indexes, feature attributes)
-                    feature_ixs = data[0]
-                    feature_attributes = data[1]
+                    feature_ixs, feature_attributes = data
 
                     for feature_ix in feature_ixs:
                         # Filling out the dataset up to feature_ix
@@ -133,7 +134,7 @@ def generate_data(
                                 X[ix] = x
                                 ix += 1
 
-                        x = self._feature_builder(
+                        x = self._configure_generate_feature(
                             feature_attributes,
                             n_samples,
                             ensure_rep=ensure_rep,
@@ -160,9 +161,9 @@ def generate_data(
 
         return X.T
 
-    def _feature_builder(
+    def _configure_generate_feature(
         self,
-        feature_attributes: int | list | np.ndarray,
+        feature_attributes: int | list | ArrayLike,
         n_samples: int,
         ensure_rep: bool = False,
         random_values: bool | None = False,
@@ -171,7 +172,7 @@ def _feature_builder(
     ) -> np.ndarray:
 
         """
-        Helper function to avoid duplicate code, builds feature
+        Helper function, calls _generate_feature with appropriate parameters based on feature_attributes
         :param feature_attributes: either integer (cardinality) or list of feature attributes
         :param n_samples: number of samples in dataset
         :param ensure_rep: ensures all values are represented at least once in the feature vector
@@ -216,7 +217,7 @@ def _feature_builder(
     def _generate_feature(
         self,
         size: int,
-        vec: list[int] | np.ndarray | None = None,
+        vec: list[int] | ArrayLike | None = None,
         cardinality: int = 5,
         ensure_rep: bool = False,
         random_values: bool | None = False,
@@ -225,7 +226,7 @@ def _generate_feature(
         p: list[float] | np.ndarray | None = None,
     ) -> np.ndarray:
         """
-        Generates feature vector of length size. Default probability density distribution is approx. normal, centred around a randomly picked value.
+        Generates feature vector of length size. Default probability density distribution is approximately normal, centred around a randomly picked value.
         :param vec: list of feature values
         :param cardinality: single value cardinality
         :param size: length of feature vector
@@ -264,10 +265,10 @@ def _generate_feature(
 
     def generate_combinations(
         self,
-        X: np.ndarray,
-        feature_indices: list[int] | np.ndarray,
+        X: ArrayLike,
+        feature_indices: list[int] | ArrayLike,
         combination_function: Optional = None,
-        combination_type: str = 'linear',
+        combination_type: Literal = 'linear',
     ) -> np.ndarray:
         """
         Generates linear, nonlinear, or custom combinations within feature vectors in given dataset X
@@ -300,11 +301,10 @@ def generate_combinations(
 
         return np.column_stack((X, combination_result))
 
-    def _xor(self, arr):
+    def _xor(self, arr: list[int] | ArrayLike) -> np.ndarray:
         """
         Performs bitwise XOR operation on two integer arrays
-        :param a: array
-        :param b: array
+        :param arr: features to perform XOR operation on
         :return: bitwise XOR result
         """
         arrT = arr.T
@@ -316,11 +316,10 @@ def _xor(self, arr):
 
         return out.T
 
-    def _and(self, arr):
+    def _and(self, arr: list[int] | ArrayLike) -> np.ndarray:
         """
         Performs bitwise AND operation on two integer arrays
-        :param a: array
-        :param b: array
+        :param arr: features to perform AND operation on
         :return: bitwise AND result
         """
         arrT = arr.T
@@ -332,11 +331,10 @@ def _and(self, arr):
 
         return out.T
 
-    def _or(self, arr):
+    def _or(self, arr: list[int] | ArrayLike) -> np.ndarray:
         """
         Performs bitwise OR operation on two integer arrays
-        :param a: array
-        :param b: array
+        :param arr: features to perform OR operation on
         :return: bitwise OR result
         """
         arrT = arr.T
@@ -350,8 +348,8 @@ def _or(self, arr):
 
     def generate_correlated(
         self,
-        X: np.ndarray,
-        feature_indices: list[int] | np.ndarray,
+        X: ArrayLike,
+        feature_indices: list[int] | ArrayLike,
         r: float = 0.8,
     ) -> np.ndarray:
 
@@ -408,8 +406,8 @@ def generate_correlated(
 
     def generate_duplicates(
         self,
-        X: np.ndarray,
-        feature_indices: list[int] | np.ndarray,
+        X: ArrayLike,
+        feature_indices: list[int] | ArrayLike,
     ) -> np.ndarray:
         """
         Generates duplicate features
@@ -433,9 +431,9 @@ def generate_duplicates(
 
     def generate_labels(
         self,
-        X: np.ndarray,
+        X: ArrayLike,
         n: int = 2,
-        p: float | list[float] | np.ndarray = 0.5,
+        p: float | list[float] | ArrayLike = 0.5,
         k: int | float = 2,
         decision_function: Optional = None,
         class_relation: str = 'linear',
@@ -528,9 +526,9 @@ def generate_labels(
 
     def _cluster_data(
         self,
-        X: np.ndarray,
+        X: ArrayLike,
         n: int,
-        p: float | list[float] | np.ndarray | None = 1.0,
+        p: float | list[float] | ArrayLike | None = 1.0,
         balance: bool = False,
     ) -> np.ndarray:
         """
@@ -624,10 +622,10 @@ def _cluster_data(
 
     def generate_noise(
         self,
-        X: np.ndarray,
-        y: list[int] | np.ndarray,
+        X: ArrayLike,
+        y: list[int] | ArrayLike,
         p: float = 0.2,
-        type: str = 'categorical',
+        type: Literal = 'categorical',
         missing_val: str | int | float = float('-inf'),
     ) -> np.ndarray:
 
@@ -718,12 +716,12 @@ def generate_noise(
 
     def downsample_dataset(
         self,
-        X: np.array,
-        y: list[int] | np.ndarray,
-        N: int | None | None = None,
+        X: ArrayLike,
+        y: list[int] | ArrayLike,
+        N: int | None = None,
         seed: int = 42,
         reshuffle: bool = False,
-    ) -> tuple[np.array, np.ndarray]:
+    ) -> tuple[np.ndarray, np.ndarray]:
 
         """
         Downsamples dataset X according to N or the number of samples in minority class, resulting in a balanced dataset.
@@ -777,7 +775,11 @@ def downsample_dataset(
 
         return X_downsampled, y_downsampled
 
-    def print_dataset(self, X, y):
+    def print_dataset(
+        self,
+        X: ArrayLike,
+        y: ArrayLike,
+    ):
         """
         Prints given dataset
         :param X: dataset
@@ -803,7 +805,7 @@ def summarize(self):
         print(f"Number of generated samples: {self.dataset_info['general']['n_samples']}")
         if self.dataset_info['downsampling']:
             print(
-                f"Dataset downsampled from shape {self.dataset_info['downsampling']['original_shape']},to shape {self.dataset_info['downsampling']['downsampled_shape']}",
+                f"Dataset downsampled from shape {self.dataset_info['downsampling']['original_shape']}, to shape {self.dataset_info['downsampling']['downsampled_shape']}",
             )
         print(f"Number of classes: {self.dataset_info['labels']['n_class']}")
         print(f"Class relation: {self.dataset_info['labels']['class_relation']}")
diff --git a/tests/cc_generator_tests.py b/tests/cc_generator_tests.py
index 860b079..1cc0796 100644
--- a/tests/cc_generator_tests.py
+++ b/tests/cc_generator_tests.py
@@ -159,4 +159,4 @@ def test_generate_labels_class_relation_cluster(self):
         X = self.cc_instance.generate_data(n_features=5, n_samples=100)
         labels = self.cc_instance.generate_labels(X, class_relation='cluster')
         self.assertIsInstance(labels, np.ndarray, 'Output should be a numpy array')
-        self.assertEqual(labels.shape, (100,), 'Shape should be (n_samples,)')
\ No newline at end of file
+        self.assertEqual(labels.shape, (100,), 'Shape should be (n_samples,)')

From fc029a26ec59e226e53d34e653e0d1c2305c9510 Mon Sep 17 00:00:00 2001
From: 98MM <47939788+98MM@users.noreply.github.com>
Date: Fri, 12 Jul 2024 10:41:45 +0200
Subject: [PATCH 7/9] Added documentation for feature generation

Small demo code in DOCSMAIN as well as pdoc entry
---
 docs/DOCSMAIN.md                              |   20 +
 docs/outrank.html                             |   38 +-
 docs/outrank/algorithms.html                  |   12 +-
 docs/outrank/algorithms/feature_ranking.html  |   12 +-
 .../feature_ranking/ranking_mi_numba.html     |   10 +-
 .../algorithms/importance_estimator.html      |  624 ++--
 docs/outrank/algorithms/sketches.html         |   12 +-
 .../algorithms/sketches/counting_cms.html     |  554 ++++
 .../sketches/counting_counters_ordinary.html  |  413 +++
 .../sketches/counting_ultiloglog.html         |   52 +-
 .../algorithms/synthetic_data_generators.html |   13 +-
 .../cc_generator.html                         | 2832 ++++++++++++++++
 .../generator_naive.html                      |  128 +-
 docs/outrank/core_ranking.html                | 2837 ++++++++---------
 docs/outrank/core_selftest.html               |    6 +-
 docs/outrank/core_utils.html                  | 1196 +++----
 docs/outrank/feature_transformations.html     |   12 +-
 .../feature_transformer_vault.html            |   23 +-
 .../default_transformers.html                 |   93 +-
 .../fw_transformers.html                      |   89 +-
 .../ranking_transformers.html                 |   62 +-
 docs/outrank/task_generators.html             |   14 +-
 docs/outrank/task_instance_ranking.html       |  521 +++
 docs/outrank/task_ranking.html                |   10 +-
 docs/outrank/task_selftest.html               |   32 +-
 docs/outrank/task_summary.html                |  160 +-
 docs/outrank/task_visualization.html          |   10 +-
 docs/outrank/visualizations.html              |   12 +-
 .../visualizations/ranking_visualization.html |   18 +-
 docs/search.js                                |    4 +-
 30 files changed, 7161 insertions(+), 2658 deletions(-)
 create mode 100644 docs/outrank/algorithms/sketches/counting_cms.html
 create mode 100644 docs/outrank/algorithms/sketches/counting_counters_ordinary.html
 create mode 100644 docs/outrank/algorithms/synthetic_data_generators/cc_generator.html
 create mode 100644 docs/outrank/task_instance_ranking.html

diff --git a/docs/DOCSMAIN.md b/docs/DOCSMAIN.md
index 1b6681a..fae8ec4 100644
--- a/docs/DOCSMAIN.md
+++ b/docs/DOCSMAIN.md
@@ -64,3 +64,23 @@ scores = [lowest_score, medium_score, high_score]
 sorted_score_indices = np.argsort(scores)
 assert np.sum(np.array([0, 1, 2]) - sorted_score_indices) ==  0
 ```
+---
+## Creating a simple dataset 
+```python
+from outrank.algorithms.synthetic_data_generators.cc_generator import CategoricalClassification
+
+cc = CategoricalClassification()
+
+# Creates a simple dataset of 10 features, 10k samples, with feature cardinality of all features being 35
+X = cc.generate_data(9, 
+                     10000, 
+                     cardinality=35, 
+                     ensure_rep=True, 
+                     random_values=True, 
+                     low=0, 
+                     high=40)
+
+# Creates target labels via clustering
+y = cc.generate_labels(X, n=2, class_relation='cluster')
+
+```
\ No newline at end of file
diff --git a/docs/outrank.html b/docs/outrank.html
index 461d09d..6af2d42 100644
--- a/docs/outrank.html
+++ b/docs/outrank.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -26,7 +26,10 @@ <h2>Contents</h2>
   <li><a href="#welcome-to-outranks-documentation">Welcome to OutRank's documentation!</a></li>
   <li><a href="#setup">Setup</a></li>
   <li><a href="#example-use-cases">Example use cases</a></li>
-  <li><a href="#outrank-as-a-python-library">OutRank as a Python library</a></li>
+  <li><a href="#outrank-as-a-python-library">OutRank as a Python library</a>
+  <ul>
+    <li><a href="#creating-a-simple-dataset">Creating a simple dataset</a></li>
+  </ul></li>
 </ul>
 
 
@@ -38,6 +41,7 @@ <h2>Submodules</h2>
                     <li><a href="outrank/core_utils.html">core_utils</a></li>
                     <li><a href="outrank/feature_transformations.html">feature_transformations</a></li>
                     <li><a href="outrank/task_generators.html">task_generators</a></li>
+                    <li><a href="outrank/task_instance_ranking.html">task_instance_ranking</a></li>
                     <li><a href="outrank/task_ranking.html">task_ranking</a></li>
                     <li><a href="outrank/task_selftest.html">task_selftest</a></li>
                     <li><a href="outrank/task_summary.html">task_summary</a></li>
@@ -129,6 +133,29 @@ <h1 id="outrank-as-a-python-library">OutRank as a Python library</h1>
 <span class="k">assert</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">2</span><span class="p">])</span> <span class="o">-</span> <span class="n">sorted_score_indices</span><span class="p">)</span> <span class="o">==</span>  <span class="mi">0</span>
 </code></pre>
 </div>
+
+<hr />
+
+<h2 id="creating-a-simple-dataset">Creating a simple dataset</h2>
+
+<div class="pdoc-code codehilite">
+<pre><span></span><code><span class="kn">from</span> <span class="nn"><a href="outrank/algorithms/synthetic_data_generators/cc_generator.html">outrank.algorithms.synthetic_data_generators.cc_generator</a></span> <span class="kn">import</span> <span class="n">CategoricalClassification</span>
+
+<span class="n">cc</span> <span class="o">=</span> <span class="n">CategoricalClassification</span><span class="p">()</span>
+
+<span class="c1"># Creates a simple dataset of 10 features, 10k samples, with feature cardinality of all features being 35</span>
+<span class="n">X</span> <span class="o">=</span> <span class="n">cc</span><span class="o">.</span><span class="n">generate_data</span><span class="p">(</span><span class="mi">9</span><span class="p">,</span> 
+                     <span class="mi">10000</span><span class="p">,</span> 
+                     <span class="n">cardinality</span><span class="o">=</span><span class="mi">35</span><span class="p">,</span> 
+                     <span class="n">ensure_rep</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> 
+                     <span class="n">random_values</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> 
+                     <span class="n">low</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> 
+                     <span class="n">high</span><span class="o">=</span><span class="mi">40</span><span class="p">)</span>
+
+<span class="c1"># Creates target labels via clustering</span>
+<span class="n">y</span> <span class="o">=</span> <span class="n">cc</span><span class="o">.</span><span class="n">generate_labels</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">n</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span> <span class="n">class_relation</span><span class="o">=</span><span class="s1">&#39;cluster&#39;</span><span class="p">)</span>
+</code></pre>
+</div>
 </div>
 
                         <input id="mod-outrank-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
@@ -137,8 +164,9 @@ <h1 id="outrank-as-a-python-library">OutRank as a Python library</h1>
 
                         <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos">1</span></a><span class="sd">&quot;&quot;&quot;</span>
 </span><span id="L-2"><a href="#L-2"><span class="linenos">2</span></a><span class="sd">.. include:: ../docs/DOCSMAIN.md</span>
-</span><span id="L-3"><a href="#L-3"><span class="linenos">3</span></a><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="L-4"><a href="#L-4"><span class="linenos">4</span></a><span class="kn">from</span> <span class="nn">__future__</span> <span class="kn">import</span> <span class="n">annotations</span>
+</span><span id="L-3"><a href="#L-3"><span class="linenos">3</span></a><span class="sd">.. include:: ../docs/generator_docs.md</span>
+</span><span id="L-4"><a href="#L-4"><span class="linenos">4</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-5"><a href="#L-5"><span class="linenos">5</span></a><span class="kn">from</span> <span class="nn">__future__</span> <span class="kn">import</span> <span class="n">annotations</span>
 </span></pre></div>
 
 
@@ -326,4 +354,4 @@ <h1 id="outrank-as-a-python-library">OutRank as a Python library</h1>
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/algorithms.html b/docs/outrank/algorithms.html
index 94d44f0..3d656cb 100644
--- a/docs/outrank/algorithms.html
+++ b/docs/outrank/algorithms.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.algorithms API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -49,10 +49,10 @@ <h2>Submodules</h2>
                     <h1 class="modulename">
 <a href="./../outrank.html">outrank</a><wbr>.algorithms    </h1>
 
-
-
-
-
+                
+                
+                
+                
             </section>
     </main>
 <script>
@@ -237,4 +237,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/algorithms/feature_ranking.html b/docs/outrank/algorithms/feature_ranking.html
index 9f0d614..9e05eec 100644
--- a/docs/outrank/algorithms/feature_ranking.html
+++ b/docs/outrank/algorithms/feature_ranking.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.algorithms.feature_ranking API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -46,10 +46,10 @@ <h2>Submodules</h2>
                     <h1 class="modulename">
 <a href="./../../outrank.html">outrank</a><wbr>.<a href="./../algorithms.html">algorithms</a><wbr>.feature_ranking    </h1>
 
-
-
-
-
+                
+                
+                
+                
             </section>
     </main>
 <script>
@@ -234,4 +234,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/algorithms/feature_ranking/ranking_mi_numba.html b/docs/outrank/algorithms/feature_ranking/ranking_mi_numba.html
index 78d3cc0..6d4bb3d 100644
--- a/docs/outrank/algorithms/feature_ranking/ranking_mi_numba.html
+++ b/docs/outrank/algorithms/feature_ranking/ranking_mi_numba.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.algorithms.feature_ranking.ranking_mi_numba API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -61,7 +61,7 @@ <h2>API Documentation</h2>
                     <h1 class="modulename">
 <a href="./../../../outrank.html">outrank</a><wbr>.<a href="./../../algorithms.html">algorithms</a><wbr>.<a href="./../feature_ranking.html">feature_ranking</a><wbr>.ranking_mi_numba    </h1>
 
-
+                
                         <input id="mod-ranking_mi_numba-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 
                         <label class="view-source-button" for="mod-ranking_mi_numba-view-source"><span>View Source</span></label>
@@ -367,7 +367,7 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                 </section>
                 <section id="compute_entropies">
@@ -501,7 +501,7 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                 </section>
                 <section id="mutual_info_estimator_numba">
@@ -734,4 +734,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/algorithms/importance_estimator.html b/docs/outrank/algorithms/importance_estimator.html
index 42a69fe..76a2c80 100644
--- a/docs/outrank/algorithms/importance_estimator.html
+++ b/docs/outrank/algorithms/importance_estimator.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.algorithms.importance_estimator API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -33,6 +33,9 @@ <h2>API Documentation</h2>
             <li>
                     <a class="variable" href="#logger">logger</a>
             </li>
+            <li>
+                    <a class="variable" href="#num_folds">num_folds</a>
+            </li>
             <li>
                     <a class="function" href="#sklearn_MI">sklearn_MI</a>
             </li>
@@ -54,6 +57,9 @@ <h2>API Documentation</h2>
             <li>
                     <a class="function" href="#get_importances_estimate_nonmyopic">get_importances_estimate_nonmyopic</a>
             </li>
+            <li>
+                    <a class="function" href="#initialize_classifier">initialize_classifier</a>
+            </li>
     </ul>
 
 
@@ -70,7 +76,7 @@ <h2>API Documentation</h2>
                     <h1 class="modulename">
 <a href="./../../outrank.html">outrank</a><wbr>.<a href="./../algorithms.html">algorithms</a><wbr>.importance_estimator    </h1>
 
-
+                
                         <input id="mod-importance_estimator-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 
                         <label class="view-source-button" for="mod-importance_estimator-view-source"><span>View Source</span></label>
@@ -89,62 +95,62 @@ <h1 class="modulename">
 </span><span id="L-12"><a href="#L-12"><span class="linenos"> 12</span></a><span class="kn">from</span> <span class="nn">scipy.stats</span> <span class="kn">import</span> <span class="n">pearsonr</span>
 </span><span id="L-13"><a href="#L-13"><span class="linenos"> 13</span></a><span class="kn">from</span> <span class="nn">sklearn.feature_selection</span> <span class="kn">import</span> <span class="n">mutual_info_classif</span>
 </span><span id="L-14"><a href="#L-14"><span class="linenos"> 14</span></a><span class="kn">from</span> <span class="nn">sklearn.linear_model</span> <span class="kn">import</span> <span class="n">LogisticRegression</span>
-</span><span id="L-15"><a href="#L-15"><span class="linenos"> 15</span></a><span class="kn">from</span> <span class="nn">sklearn.metrics</span> <span class="kn">import</span> <span class="n">adjusted_mutual_info_score</span>
-</span><span id="L-16"><a href="#L-16"><span class="linenos"> 16</span></a><span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">cross_val_score</span>
-</span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a><span class="kn">from</span> <span class="nn">sklearn.preprocessing</span> <span class="kn">import</span> <span class="n">OneHotEncoder</span>
-</span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a><span class="kn">from</span> <span class="nn">sklearn.svm</span> <span class="kn">import</span> <span class="n">SVC</span>
-</span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a>
-</span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a><span class="n">logger</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">getLogger</span><span class="p">(</span><span class="s1">&#39;syn-logger&#39;</span><span class="p">)</span>
-</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
+</span><span id="L-15"><a href="#L-15"><span class="linenos"> 15</span></a><span class="kn">from</span> <span class="nn">sklearn.linear_model</span> <span class="kn">import</span> <span class="n">SGDClassifier</span>
+</span><span id="L-16"><a href="#L-16"><span class="linenos"> 16</span></a><span class="kn">from</span> <span class="nn">sklearn.metrics</span> <span class="kn">import</span> <span class="n">adjusted_mutual_info_score</span>
+</span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a><span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">cross_val_score</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a><span class="kn">from</span> <span class="nn">sklearn.preprocessing</span> <span class="kn">import</span> <span class="n">OneHotEncoder</span>
+</span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a><span class="kn">from</span> <span class="nn">sklearn.svm</span> <span class="kn">import</span> <span class="n">SVC</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a>
+</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">is_prior_heuristic</span>
 </span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a>
-</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a><span class="k">try</span><span class="p">:</span>
-</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a>    <span class="kn">from</span> <span class="nn">outrank.algorithms.feature_ranking</span> <span class="kn">import</span> <span class="n">ranking_mi_numba</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a><span class="n">logger</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">getLogger</span><span class="p">(</span><span class="s1">&#39;syn-logger&#39;</span><span class="p">)</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
 </span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a>
-</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a>    <span class="n">numba_available</span> <span class="o">=</span> <span class="kc">True</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a><span class="n">num_folds</span> <span class="o">=</span> <span class="mi">4</span>
 </span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a>
-</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a><span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">es</span><span class="p">:</span>
-</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a>    <span class="n">traceback</span><span class="o">.</span><span class="n">print_exc</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a>    <span class="n">numba_available</span> <span class="o">=</span> <span class="kc">False</span>
-</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a>
+</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a><span class="k">try</span><span class="p">:</span>
+</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a>    <span class="kn">from</span> <span class="nn">outrank.algorithms.feature_ranking</span> <span class="kn">import</span> <span class="n">ranking_mi_numba</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a>
+</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a>    <span class="n">numba_available</span> <span class="o">=</span> <span class="kc">True</span>
 </span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a>
-</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a><span class="k">def</span> <span class="nf">sklearn_MI</span><span class="p">(</span><span class="n">vector_first</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
-</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a>    <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">mutual_info_classif</span><span class="p">(</span>
-</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a>        <span class="n">vector_first</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">),</span> <span class="n">vector_second</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">),</span> <span class="n">discrete_features</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a>    <span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a>    <span class="k">return</span> <span class="n">estimate_feature_importance</span>
-</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a>
-</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a>
-</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a><span class="k">def</span> <span class="nf">sklearn_surrogate</span><span class="p">(</span>
-</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a>    <span class="n">vector_first</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">surrogate_model</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
-</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a>    <span class="k">if</span> <span class="n">surrogate_model</span> <span class="o">==</span> <span class="s1">&#39;surrogate-LR&#39;</span><span class="p">:</span>
-</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a>        <span class="n">clf</span> <span class="o">=</span> <span class="n">LogisticRegression</span><span class="p">(</span><span class="n">max_iter</span><span class="o">=</span><span class="mi">100000</span><span class="p">)</span>
-</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a>    <span class="k">elif</span> <span class="n">surrogate_model</span> <span class="o">==</span> <span class="s1">&#39;surrogate-SVM&#39;</span><span class="p">:</span>
-</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a>        <span class="n">clf</span> <span class="o">=</span> <span class="n">SVC</span><span class="p">(</span><span class="n">gamma</span><span class="o">=</span><span class="s1">&#39;auto&#39;</span><span class="p">,</span> <span class="n">probability</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a>
-</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a>    <span class="n">transf</span> <span class="o">=</span> <span class="n">OneHotEncoder</span><span class="p">()</span>
-</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a>
-</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a>    <span class="c1"># They do not commute, swap if needed</span>
-</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">vector_second</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">):</span>
-</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a>        <span class="n">vector_third</span> <span class="o">=</span> <span class="n">vector_second</span>
-</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a>        <span class="n">vector_second</span> <span class="o">=</span> <span class="n">vector_first</span>
-</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a>        <span class="n">vector_first</span> <span class="o">=</span> <span class="n">vector_third</span>
-</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a>        <span class="k">del</span> <span class="n">vector_third</span>
-</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a>
-</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a>    <span class="n">unique_values</span><span class="p">,</span> <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">vector_second</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a>
-</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a>    <span class="c1"># Establish min support for this type of ranking.</span>
-</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>    <span class="k">if</span> <span class="n">counts</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">&lt;</span> <span class="nb">len</span><span class="p">(</span><span class="n">unique_values</span><span class="p">)</span> <span class="o">*</span> <span class="p">(</span><span class="mi">2</span><span class="o">**</span><span class="mi">5</span><span class="p">):</span>
-</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a>
-</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a>        <span class="n">vector_first</span> <span class="o">=</span> <span class="n">transf</span><span class="o">.</span><span class="n">fit_transform</span><span class="p">(</span><span class="n">vector_first</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">))</span>
-</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>        <span class="n">estimate_feature_importance_list</span> <span class="o">=</span> <span class="n">cross_val_score</span><span class="p">(</span>
-</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a>            <span class="n">clf</span><span class="p">,</span> <span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">,</span> <span class="n">scoring</span><span class="o">=</span><span class="s1">&#39;neg_log_loss&#39;</span><span class="p">,</span> <span class="n">cv</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span>
-</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a>        <span class="p">)</span>
-</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a>
-</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="mi">1</span> <span class="o">+</span> \
-</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="n">estimate_feature_importance_list</span><span class="p">)</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a><span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">es</span><span class="p">:</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a>    <span class="n">traceback</span><span class="o">.</span><span class="n">print_exc</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a>    <span class="n">numba_available</span> <span class="o">=</span> <span class="kc">False</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a>
+</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a>
+</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a><span class="k">def</span> <span class="nf">sklearn_MI</span><span class="p">(</span><span class="n">vector_first</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a>    <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">mutual_info_classif</span><span class="p">(</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a>        <span class="n">vector_first</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">),</span> <span class="n">vector_second</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">),</span> <span class="n">discrete_features</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a>    <span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a>    <span class="k">return</span> <span class="n">estimate_feature_importance</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a>
+</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a>
+</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a><span class="k">def</span> <span class="nf">sklearn_surrogate</span><span class="p">(</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a>    <span class="n">vector_first</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">X</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">surrogate_model</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a>
+</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a>    <span class="n">clf</span> <span class="o">=</span> <span class="n">initialize_classifier</span><span class="p">(</span><span class="n">surrogate_model</span><span class="p">)</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a>
+</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a>    <span class="n">transf</span> <span class="o">=</span> <span class="n">OneHotEncoder</span><span class="p">()</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a>
+</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a>    <span class="c1"># They do not commute, swap if needed</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">vector_second</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">):</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a>        <span class="n">vector_third</span> <span class="o">=</span> <span class="n">vector_second</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a>        <span class="n">vector_second</span> <span class="o">=</span> <span class="n">vector_first</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a>        <span class="n">vector_first</span> <span class="o">=</span> <span class="n">vector_third</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a>        <span class="k">del</span> <span class="n">vector_third</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a>
+</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>    <span class="k">if</span> <span class="n">X</span><span class="o">.</span><span class="n">size</span> <span class="o">&lt;=</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a>        <span class="n">X</span> <span class="o">=</span> <span class="n">vector_first</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a>        <span class="n">X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">vector_first</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">)),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a>
+</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>    <span class="n">X</span> <span class="o">=</span> <span class="n">transf</span><span class="o">.</span><span class="n">fit_transform</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a>    <span class="n">estimate_feature_importance_list</span> <span class="o">=</span> <span class="n">cross_val_score</span><span class="p">(</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a>        <span class="n">clf</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">,</span> <span class="n">scoring</span><span class="o">=</span><span class="s1">&#39;neg_log_loss&#39;</span><span class="p">,</span> <span class="n">cv</span><span class="o">=</span><span class="n">num_folds</span><span class="p">,</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a>    <span class="p">)</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a>    <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="mi">1</span> <span class="o">+</span> \
+</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="n">estimate_feature_importance_list</span><span class="p">)</span>
 </span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>
 </span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a>    <span class="k">return</span> <span class="n">estimate_feature_importance</span>
 </span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a>
@@ -174,7 +180,7 @@ <h1 class="modulename">
 </span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a>    <span class="k">return</span> <span class="n">estimate_feature_importance</span>
 </span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a>
 </span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>
-</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a><span class="k">def</span> <span class="nf">get_importances_estimate_pairwise</span><span class="p">(</span><span class="n">combination</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">):</span>
+</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a><span class="k">def</span> <span class="nf">get_importances_estimate_pairwise</span><span class="p">(</span><span class="n">combination</span><span class="p">,</span> <span class="n">reference_model_features</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">):</span>
 </span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;A method for parallel importances estimation. As interaction scoring is independent, individual scores can be computed in parallel.&quot;&quot;&quot;</span>
 </span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a>
 </span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a>    <span class="n">feature_one</span> <span class="o">=</span> <span class="n">combination</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
@@ -199,97 +205,113 @@ <h1 class="modulename">
 </span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">sklearn_MI</span><span class="p">(</span><span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">)</span>
 </span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a>
 </span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>    <span class="k">elif</span> <span class="s1">&#39;surrogate-&#39;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">:</span>
-</span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">sklearn_surrogate</span><span class="p">(</span>
-</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a>            <span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">,</span>
-</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a>        <span class="p">)</span>
+</span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>        <span class="n">X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">float</span><span class="p">)</span>
+</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a>        <span class="k">if</span> <span class="n">is_prior_heuristic</span><span class="p">(</span><span class="n">args</span><span class="p">)</span> <span class="ow">and</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">reference_model_features</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">):</span>
+</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a>            <span class="n">X</span> <span class="o">=</span> <span class="n">tmp_df</span><span class="p">[</span><span class="n">reference_model_features</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
 </span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a>
-</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a>    <span class="k">elif</span> <span class="s1">&#39;MI-numba&#39;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">:</span>
-</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">numba_mi</span><span class="p">(</span>
-</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a>            <span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">mi_stratified_sampling_ratio</span><span class="p">,</span>
-</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a>        <span class="p">)</span>
-</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a>
-</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a>    <span class="k">elif</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">==</span> <span class="s1">&#39;AMI&#39;</span><span class="p">:</span>
-</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">sklearn_mi_adj</span><span class="p">(</span>
-</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a>            <span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">,</span>
-</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a>        <span class="p">)</span>
-</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a>
-</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a>    <span class="k">elif</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">==</span> <span class="s1">&#39;correlation-Pearson&#39;</span><span class="p">:</span>
-</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">pearsonr</span><span class="p">(</span><span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a>
-</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a>    <span class="k">elif</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">==</span> <span class="s1">&#39;Constant&#39;</span><span class="p">:</span>
-</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="mf">0.0</span>
-</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a>
-</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a>            <span class="s1">&#39;Please select one of the possible heuristics (MI, chi2)&#39;</span><span class="p">,</span>
-</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a>        <span class="p">)</span>
-</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a>
-</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a>    <span class="k">return</span> <span class="p">(</span><span class="n">feature_one</span><span class="p">,</span> <span class="n">feature_two</span><span class="p">,</span> <span class="n">estimate_feature_importance</span><span class="p">)</span>
-</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a>
-</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a>
-</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a><span class="k">def</span> <span class="nf">rank_features_3MR</span><span class="p">(</span>
-</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a>    <span class="n">relevance_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">],</span>
-</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a>    <span class="n">redundancy_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="n">Any</span><span class="p">],</span>
-</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a>    <span class="n">relational_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="n">Any</span><span class="p">],</span>
-</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a>    <span class="n">strategy</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;median&#39;</span><span class="p">,</span>
-</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a>    <span class="n">alpha</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
-</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a>    <span class="n">beta</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
-</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a>    <span class="n">all_features</span> <span class="o">=</span> <span class="n">relevance_dict</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
-</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a>    <span class="n">most_important_feature</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span>
-</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a>        <span class="n">relevance_dict</span><span class="o">.</span><span class="n">items</span><span class="p">(),</span> <span class="n">key</span><span class="o">=</span><span class="n">operator</span><span class="o">.</span><span class="n">itemgetter</span><span class="p">(</span><span class="mi">1</span><span class="p">),</span>
-</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a>    <span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a>    <span class="n">ranked_features</span> <span class="o">=</span> <span class="p">[</span><span class="n">most_important_feature</span><span class="p">]</span>
-</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a>
-</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>    <span class="k">def</span> <span class="nf">calc_higher_order</span><span class="p">(</span><span class="n">feature</span><span class="p">,</span> <span class="n">is_redundancy</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a>        <span class="n">values</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a>        <span class="k">for</span> <span class="n">feat</span> <span class="ow">in</span> <span class="n">ranked_features</span><span class="p">:</span>
-</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a>            <span class="n">interaction_tuple</span> <span class="o">=</span> <span class="p">(</span><span class="n">feat</span><span class="p">,</span> <span class="n">feature</span><span class="p">)</span>
-</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a>            <span class="k">if</span> <span class="n">is_redundancy</span><span class="p">:</span>
-</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a>                <span class="k">if</span> <span class="n">interaction_tuple</span> <span class="ow">in</span> <span class="n">redundancy_dict</span><span class="p">:</span>
-</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a>                    <span class="n">values</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">redundancy_dict</span><span class="p">[</span><span class="n">interaction_tuple</span><span class="p">])</span>
-</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a>                    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Not accounting for redundancy tuple </span><span class="si">{}</span><span class="s1"> - please increase the --combination_number_upper_bound for beter coverage of interactions/redundancies.&#39;</span><span class="p">)</span>
-</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a>                <span class="k">if</span> <span class="n">interaction_tuple</span> <span class="ow">in</span> <span class="n">relational_dict</span><span class="p">:</span>
-</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a>                    <span class="n">values</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">relational_dict</span><span class="p">[</span><span class="n">interaction_tuple</span><span class="p">])</span>
-</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a>                    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Not accounting for interaction tuple </span><span class="si">{}</span><span class="s1"> - please increase the --combination_number_upper_bound for beter coverage of interactions/redundancies.&#39;</span><span class="p">)</span>
-</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a>
-</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a>        <span class="k">if</span> <span class="n">strategy</span> <span class="o">==</span> <span class="s1">&#39;sum&#39;</span><span class="p">:</span>
-</span><span id="L-183"><a href="#L-183"><span class="linenos">183</span></a>            <span class="k">return</span> <span class="nb">sum</span><span class="p">(</span><span class="n">values</span><span class="p">)</span>
-</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a>        <span class="k">if</span> <span class="n">strategy</span> <span class="o">==</span> <span class="s1">&#39;mean&#39;</span><span class="p">:</span>
-</span><span id="L-185"><a href="#L-185"><span class="linenos">185</span></a>            <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">values</span><span class="p">)</span>
-</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="n">values</span><span class="p">)</span>
-</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a>
-</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a>    <span class="k">while</span> <span class="nb">len</span><span class="p">(</span><span class="n">ranked_features</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">all_features</span><span class="p">):</span>
-</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a>        <span class="n">top_importance</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a>        <span class="n">most_important_feature</span> <span class="o">=</span> <span class="s1">&#39;&#39;</span>
+</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">sklearn_surrogate</span><span class="p">(</span>
+</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a>            <span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">,</span>
+</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a>        <span class="p">)</span>
+</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a>
+</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a>    <span class="k">elif</span> <span class="s1">&#39;MI-numba&#39;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">:</span>
+</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">numba_mi</span><span class="p">(</span>
+</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a>            <span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">mi_stratified_sampling_ratio</span><span class="p">,</span>
+</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a>        <span class="p">)</span>
+</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a>
+</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a>    <span class="k">elif</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">==</span> <span class="s1">&#39;AMI&#39;</span><span class="p">:</span>
+</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">sklearn_mi_adj</span><span class="p">(</span>
+</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a>            <span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">,</span>
+</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a>        <span class="p">)</span>
+</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a>
+</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a>    <span class="k">elif</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">==</span> <span class="s1">&#39;correlation-Pearson&#39;</span><span class="p">:</span>
+</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">pearsonr</span><span class="p">(</span><span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a>
+</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a>    <span class="k">elif</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">==</span> <span class="s1">&#39;Constant&#39;</span><span class="p">:</span>
+</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="mf">0.0</span>
+</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a>
+</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a>            <span class="s1">&#39;Please select one of the possible heuristics (MI, chi2)&#39;</span><span class="p">,</span>
+</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a>        <span class="p">)</span>
+</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a>
+</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a>    <span class="k">return</span> <span class="p">(</span><span class="n">feature_one</span><span class="p">,</span> <span class="n">feature_two</span><span class="p">,</span> <span class="n">estimate_feature_importance</span><span class="p">)</span>
+</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a>
+</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a>
+</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a><span class="k">def</span> <span class="nf">rank_features_3MR</span><span class="p">(</span>
+</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a>    <span class="n">relevance_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">],</span>
+</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a>    <span class="n">redundancy_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="n">Any</span><span class="p">],</span>
+</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a>    <span class="n">relational_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="n">Any</span><span class="p">],</span>
+</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a>    <span class="n">strategy</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;median&#39;</span><span class="p">,</span>
+</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a>    <span class="n">alpha</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a>    <span class="n">beta</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a>    <span class="n">all_features</span> <span class="o">=</span> <span class="n">relevance_dict</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a>    <span class="n">most_important_feature</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span>
+</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>        <span class="n">relevance_dict</span><span class="o">.</span><span class="n">items</span><span class="p">(),</span> <span class="n">key</span><span class="o">=</span><span class="n">operator</span><span class="o">.</span><span class="n">itemgetter</span><span class="p">(</span><span class="mi">1</span><span class="p">),</span>
+</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a>    <span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a>    <span class="n">ranked_features</span> <span class="o">=</span> <span class="p">[</span><span class="n">most_important_feature</span><span class="p">]</span>
+</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a>
+</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a>    <span class="k">def</span> <span class="nf">calc_higher_order</span><span class="p">(</span><span class="n">feature</span><span class="p">,</span> <span class="n">is_redundancy</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
+</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a>        <span class="n">values</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a>        <span class="k">for</span> <span class="n">feat</span> <span class="ow">in</span> <span class="n">ranked_features</span><span class="p">:</span>
+</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a>            <span class="n">interaction_tuple</span> <span class="o">=</span> <span class="p">(</span><span class="n">feat</span><span class="p">,</span> <span class="n">feature</span><span class="p">)</span>
+</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a>            <span class="k">if</span> <span class="n">is_redundancy</span><span class="p">:</span>
+</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a>                <span class="k">if</span> <span class="n">interaction_tuple</span> <span class="ow">in</span> <span class="n">redundancy_dict</span><span class="p">:</span>
+</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a>                    <span class="n">values</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">redundancy_dict</span><span class="p">[</span><span class="n">interaction_tuple</span><span class="p">])</span>
+</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a>                    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Not accounting for redundancy tuple </span><span class="si">{}</span><span class="s1"> - please increase the --combination_number_upper_bound for beter coverage of interactions/redundancies.&#39;</span><span class="p">)</span>
+</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a>                <span class="k">if</span> <span class="n">interaction_tuple</span> <span class="ow">in</span> <span class="n">relational_dict</span><span class="p">:</span>
+</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a>                    <span class="n">values</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">relational_dict</span><span class="p">[</span><span class="n">interaction_tuple</span><span class="p">])</span>
+</span><span id="L-183"><a href="#L-183"><span class="linenos">183</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a>                    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Not accounting for interaction tuple </span><span class="si">{}</span><span class="s1"> - please increase the --combination_number_upper_bound for beter coverage of interactions/redundancies.&#39;</span><span class="p">)</span>
+</span><span id="L-185"><a href="#L-185"><span class="linenos">185</span></a>
+</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a>        <span class="k">if</span> <span class="n">strategy</span> <span class="o">==</span> <span class="s1">&#39;sum&#39;</span><span class="p">:</span>
+</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a>            <span class="k">return</span> <span class="nb">sum</span><span class="p">(</span><span class="n">values</span><span class="p">)</span>
+</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a>        <span class="k">if</span> <span class="n">strategy</span> <span class="o">==</span> <span class="s1">&#39;mean&#39;</span><span class="p">:</span>
+</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a>            <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">values</span><span class="p">)</span>
+</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="n">values</span><span class="p">)</span>
 </span><span id="L-191"><a href="#L-191"><span class="linenos">191</span></a>
-</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a>        <span class="k">for</span> <span class="n">ind</span><span class="p">,</span> <span class="n">feat</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">all_features</span><span class="p">)</span> <span class="o">-</span> <span class="nb">set</span><span class="p">(</span><span class="n">ranked_features</span><span class="p">)):</span>
-</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a>            <span class="n">feature_redundancy</span> <span class="o">=</span> <span class="n">calc_higher_order</span><span class="p">(</span><span class="n">feat</span><span class="p">)</span>
-</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a>            <span class="n">feature_relation</span> <span class="o">=</span> <span class="n">calc_higher_order</span><span class="p">(</span><span class="n">feat</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
-</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a>            <span class="n">feature_relevance</span> <span class="o">=</span> <span class="n">relevance_dict</span><span class="p">[</span><span class="n">feat</span><span class="p">]</span>
-</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a>            <span class="n">importance</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a>                <span class="n">feature_relevance</span> <span class="o">-</span> <span class="n">alpha</span> <span class="o">*</span> <span class="n">feature_redundancy</span> <span class="o">+</span> <span class="n">beta</span> <span class="o">*</span> <span class="n">feature_relation</span>
-</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a>            <span class="p">)</span>
-</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a>
-</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a>            <span class="k">if</span> <span class="p">(</span><span class="n">importance</span> <span class="o">&gt;</span> <span class="n">top_importance</span><span class="p">)</span> <span class="ow">or</span> <span class="p">(</span><span class="n">ind</span> <span class="o">==</span> <span class="mi">0</span><span class="p">):</span>
-</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a>                <span class="n">top_importance</span> <span class="o">=</span> <span class="n">importance</span>
-</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a>                <span class="n">most_important_feature</span> <span class="o">=</span> <span class="n">feat</span>
-</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a>        <span class="n">ranked_features</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">most_important_feature</span><span class="p">)</span>
-</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a>    <span class="k">return</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span>
-</span><span id="L-205"><a href="#L-205"><span class="linenos">205</span></a>        <span class="p">{</span>
-</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a>            <span class="s1">&#39;Feature&#39;</span><span class="p">:</span> <span class="n">ranked_features</span><span class="p">,</span>
-</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a>            <span class="s1">&#39;3mr_ranking&#39;</span><span class="p">:</span> <span class="nb">list</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">ranked_features</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)),</span>
-</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a>        <span class="p">},</span>
-</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a>    <span class="p">)</span>
-</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a>
-</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a>
-</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a><span class="k">def</span> <span class="nf">get_importances_estimate_nonmyopic</span><span class="p">(</span><span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">):</span>
-</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a>    <span class="c1"># TODO - nonmyopic algorithms - tmp_df \ args.label vs. label</span>
-</span><span id="L-214"><a href="#L-214"><span class="linenos">214</span></a>    <span class="c1"># TODO - this is to be executed directly on df - no need for parallel kernel(s)</span>
-</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a>    <span class="k">pass</span>
+</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a>    <span class="k">while</span> <span class="nb">len</span><span class="p">(</span><span class="n">ranked_features</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">all_features</span><span class="p">):</span>
+</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a>        <span class="n">top_importance</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a>        <span class="n">most_important_feature</span> <span class="o">=</span> <span class="s1">&#39;&#39;</span>
+</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a>
+</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a>        <span class="k">for</span> <span class="n">ind</span><span class="p">,</span> <span class="n">feat</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">all_features</span><span class="p">)</span> <span class="o">-</span> <span class="nb">set</span><span class="p">(</span><span class="n">ranked_features</span><span class="p">)):</span>
+</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a>            <span class="n">feature_redundancy</span> <span class="o">=</span> <span class="n">calc_higher_order</span><span class="p">(</span><span class="n">feat</span><span class="p">)</span>
+</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a>            <span class="n">feature_relation</span> <span class="o">=</span> <span class="n">calc_higher_order</span><span class="p">(</span><span class="n">feat</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a>            <span class="n">feature_relevance</span> <span class="o">=</span> <span class="n">relevance_dict</span><span class="p">[</span><span class="n">feat</span><span class="p">]</span>
+</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a>            <span class="n">importance</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a>                <span class="n">feature_relevance</span> <span class="o">-</span> <span class="n">alpha</span> <span class="o">*</span> <span class="n">feature_redundancy</span> <span class="o">+</span> <span class="n">beta</span> <span class="o">*</span> <span class="n">feature_relation</span>
+</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a>            <span class="p">)</span>
+</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a>
+</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a>            <span class="k">if</span> <span class="p">(</span><span class="n">importance</span> <span class="o">&gt;</span> <span class="n">top_importance</span><span class="p">)</span> <span class="ow">or</span> <span class="p">(</span><span class="n">ind</span> <span class="o">==</span> <span class="mi">0</span><span class="p">):</span>
+</span><span id="L-205"><a href="#L-205"><span class="linenos">205</span></a>                <span class="n">top_importance</span> <span class="o">=</span> <span class="n">importance</span>
+</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a>                <span class="n">most_important_feature</span> <span class="o">=</span> <span class="n">feat</span>
+</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a>        <span class="n">ranked_features</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">most_important_feature</span><span class="p">)</span>
+</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a>    <span class="k">return</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span>
+</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a>        <span class="p">{</span>
+</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a>            <span class="s1">&#39;Feature&#39;</span><span class="p">:</span> <span class="n">ranked_features</span><span class="p">,</span>
+</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a>            <span class="s1">&#39;3mr_ranking&#39;</span><span class="p">:</span> <span class="nb">list</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">ranked_features</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)),</span>
+</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a>        <span class="p">},</span>
+</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a>    <span class="p">)</span>
+</span><span id="L-214"><a href="#L-214"><span class="linenos">214</span></a>
+</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a>
+</span><span id="L-216"><a href="#L-216"><span class="linenos">216</span></a><span class="k">def</span> <span class="nf">get_importances_estimate_nonmyopic</span><span class="p">(</span><span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">):</span>
+</span><span id="L-217"><a href="#L-217"><span class="linenos">217</span></a>    <span class="c1"># TODO - nonmyopic algorithms - tmp_df \ args.label vs. label</span>
+</span><span id="L-218"><a href="#L-218"><span class="linenos">218</span></a>    <span class="c1"># TODO - this is to be executed directly on df - no need for parallel kernel(s)</span>
+</span><span id="L-219"><a href="#L-219"><span class="linenos">219</span></a>    <span class="k">pass</span>
+</span><span id="L-220"><a href="#L-220"><span class="linenos">220</span></a>
+</span><span id="L-221"><a href="#L-221"><span class="linenos">221</span></a>
+</span><span id="L-222"><a href="#L-222"><span class="linenos">222</span></a><span class="k">def</span> <span class="nf">initialize_classifier</span><span class="p">(</span><span class="n">surrogate_model</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span>
+</span><span id="L-223"><a href="#L-223"><span class="linenos">223</span></a>    <span class="k">if</span> <span class="s1">&#39;surrogate-LR&#39;</span> <span class="ow">in</span> <span class="n">surrogate_model</span><span class="p">:</span>
+</span><span id="L-224"><a href="#L-224"><span class="linenos">224</span></a>        <span class="k">return</span> <span class="n">LogisticRegression</span><span class="p">(</span><span class="n">max_iter</span><span class="o">=</span><span class="mi">100000</span><span class="p">)</span>
+</span><span id="L-225"><a href="#L-225"><span class="linenos">225</span></a>    <span class="k">elif</span> <span class="s1">&#39;surrogate-SVM&#39;</span> <span class="ow">in</span> <span class="n">surrogate_model</span><span class="p">:</span>
+</span><span id="L-226"><a href="#L-226"><span class="linenos">226</span></a>        <span class="k">return</span> <span class="n">SVC</span><span class="p">(</span><span class="n">gamma</span><span class="o">=</span><span class="s1">&#39;auto&#39;</span><span class="p">,</span> <span class="n">probability</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="L-227"><a href="#L-227"><span class="linenos">227</span></a>    <span class="k">elif</span> <span class="s1">&#39;surrogate-SGD&#39;</span> <span class="ow">in</span> <span class="n">surrogate_model</span><span class="p">:</span>
+</span><span id="L-228"><a href="#L-228"><span class="linenos">228</span></a>        <span class="k">return</span> <span class="n">SGDClassifier</span><span class="p">(</span><span class="n">max_iter</span><span class="o">=</span><span class="mi">100000</span><span class="p">,</span> <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;log_loss&#39;</span><span class="p">)</span>
+</span><span id="L-229"><a href="#L-229"><span class="linenos">229</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="L-230"><a href="#L-230"><span class="linenos">230</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;The chosen surrogate model </span><span class="si">{</span><span class="n">surrogate_model</span><span class="si">}</span><span class="s1"> is not supported, falling back to surrogate-SGD&#39;</span><span class="p">)</span>
+</span><span id="L-231"><a href="#L-231"><span class="linenos">231</span></a>        <span class="k">return</span> <span class="n">SGDClassifier</span><span class="p">(</span><span class="n">max_iter</span><span class="o">=</span><span class="mi">100000</span><span class="p">,</span> <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;log_loss&#39;</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -299,17 +321,29 @@ <h1 class="modulename">
             <span class="name">logger</span>        =
 <span class="default_value">&lt;Logger syn-logger (DEBUG)&gt;</span>
 
-
+        
     </div>
     <a class="headerlink" href="#logger"></a>
+    
+    
 
+                </section>
+                <section id="num_folds">
+                    <div class="attr variable">
+            <span class="name">num_folds</span>        =
+<span class="default_value">4</span>
 
+        
+    </div>
+    <a class="headerlink" href="#num_folds"></a>
+    
+    
 
                 </section>
                 <section id="sklearn_MI">
                             <input id="sklearn_MI-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">sklearn_MI</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">vector_first</span><span class="p">:</span> <span class="n">Any</span>, </span><span class="param"><span class="n">vector_second</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="nb">float</span>:</span></span>
 
@@ -317,71 +351,66 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#sklearn_MI"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="sklearn_MI-34"><a href="#sklearn_MI-34"><span class="linenos">34</span></a><span class="k">def</span> <span class="nf">sklearn_MI</span><span class="p">(</span><span class="n">vector_first</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
-</span><span id="sklearn_MI-35"><a href="#sklearn_MI-35"><span class="linenos">35</span></a>    <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">mutual_info_classif</span><span class="p">(</span>
-</span><span id="sklearn_MI-36"><a href="#sklearn_MI-36"><span class="linenos">36</span></a>        <span class="n">vector_first</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">),</span> <span class="n">vector_second</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">),</span> <span class="n">discrete_features</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-</span><span id="sklearn_MI-37"><a href="#sklearn_MI-37"><span class="linenos">37</span></a>    <span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="sklearn_MI-38"><a href="#sklearn_MI-38"><span class="linenos">38</span></a>    <span class="k">return</span> <span class="n">estimate_feature_importance</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="sklearn_MI-39"><a href="#sklearn_MI-39"><span class="linenos">39</span></a><span class="k">def</span> <span class="nf">sklearn_MI</span><span class="p">(</span><span class="n">vector_first</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
+</span><span id="sklearn_MI-40"><a href="#sklearn_MI-40"><span class="linenos">40</span></a>    <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">mutual_info_classif</span><span class="p">(</span>
+</span><span id="sklearn_MI-41"><a href="#sklearn_MI-41"><span class="linenos">41</span></a>        <span class="n">vector_first</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">),</span> <span class="n">vector_second</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">),</span> <span class="n">discrete_features</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+</span><span id="sklearn_MI-42"><a href="#sklearn_MI-42"><span class="linenos">42</span></a>    <span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="sklearn_MI-43"><a href="#sklearn_MI-43"><span class="linenos">43</span></a>    <span class="k">return</span> <span class="n">estimate_feature_importance</span>
 </span></pre></div>
 
 
-
+    
 
                 </section>
                 <section id="sklearn_surrogate">
                             <input id="sklearn_surrogate-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
-        <span class="name">sklearn_surrogate</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">vector_first</span><span class="p">:</span> <span class="n">Any</span>, </span><span class="param"><span class="n">vector_second</span><span class="p">:</span> <span class="n">Any</span>, </span><span class="param"><span class="n">surrogate_model</span><span class="p">:</span> <span class="nb">str</span></span><span class="return-annotation">) -> <span class="nb">float</span>:</span></span>
+        <span class="name">sklearn_surrogate</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">vector_first</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">vector_second</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">X</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">surrogate_model</span><span class="p">:</span> <span class="nb">str</span></span><span class="return-annotation">) -> <span class="nb">float</span>:</span></span>
 
                 <label class="view-source-button" for="sklearn_surrogate-view-source"><span>View Source</span></label>
 
     </div>
     <a class="headerlink" href="#sklearn_surrogate"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="sklearn_surrogate-41"><a href="#sklearn_surrogate-41"><span class="linenos">41</span></a><span class="k">def</span> <span class="nf">sklearn_surrogate</span><span class="p">(</span>
-</span><span id="sklearn_surrogate-42"><a href="#sklearn_surrogate-42"><span class="linenos">42</span></a>    <span class="n">vector_first</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">surrogate_model</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="sklearn_surrogate-43"><a href="#sklearn_surrogate-43"><span class="linenos">43</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
-</span><span id="sklearn_surrogate-44"><a href="#sklearn_surrogate-44"><span class="linenos">44</span></a>    <span class="k">if</span> <span class="n">surrogate_model</span> <span class="o">==</span> <span class="s1">&#39;surrogate-LR&#39;</span><span class="p">:</span>
-</span><span id="sklearn_surrogate-45"><a href="#sklearn_surrogate-45"><span class="linenos">45</span></a>        <span class="n">clf</span> <span class="o">=</span> <span class="n">LogisticRegression</span><span class="p">(</span><span class="n">max_iter</span><span class="o">=</span><span class="mi">100000</span><span class="p">)</span>
-</span><span id="sklearn_surrogate-46"><a href="#sklearn_surrogate-46"><span class="linenos">46</span></a>    <span class="k">elif</span> <span class="n">surrogate_model</span> <span class="o">==</span> <span class="s1">&#39;surrogate-SVM&#39;</span><span class="p">:</span>
-</span><span id="sklearn_surrogate-47"><a href="#sklearn_surrogate-47"><span class="linenos">47</span></a>        <span class="n">clf</span> <span class="o">=</span> <span class="n">SVC</span><span class="p">(</span><span class="n">gamma</span><span class="o">=</span><span class="s1">&#39;auto&#39;</span><span class="p">,</span> <span class="n">probability</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="sklearn_surrogate-48"><a href="#sklearn_surrogate-48"><span class="linenos">48</span></a>
-</span><span id="sklearn_surrogate-49"><a href="#sklearn_surrogate-49"><span class="linenos">49</span></a>    <span class="n">transf</span> <span class="o">=</span> <span class="n">OneHotEncoder</span><span class="p">()</span>
-</span><span id="sklearn_surrogate-50"><a href="#sklearn_surrogate-50"><span class="linenos">50</span></a>
-</span><span id="sklearn_surrogate-51"><a href="#sklearn_surrogate-51"><span class="linenos">51</span></a>    <span class="c1"># They do not commute, swap if needed</span>
-</span><span id="sklearn_surrogate-52"><a href="#sklearn_surrogate-52"><span class="linenos">52</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">vector_second</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">):</span>
-</span><span id="sklearn_surrogate-53"><a href="#sklearn_surrogate-53"><span class="linenos">53</span></a>        <span class="n">vector_third</span> <span class="o">=</span> <span class="n">vector_second</span>
-</span><span id="sklearn_surrogate-54"><a href="#sklearn_surrogate-54"><span class="linenos">54</span></a>        <span class="n">vector_second</span> <span class="o">=</span> <span class="n">vector_first</span>
-</span><span id="sklearn_surrogate-55"><a href="#sklearn_surrogate-55"><span class="linenos">55</span></a>        <span class="n">vector_first</span> <span class="o">=</span> <span class="n">vector_third</span>
-</span><span id="sklearn_surrogate-56"><a href="#sklearn_surrogate-56"><span class="linenos">56</span></a>        <span class="k">del</span> <span class="n">vector_third</span>
-</span><span id="sklearn_surrogate-57"><a href="#sklearn_surrogate-57"><span class="linenos">57</span></a>
-</span><span id="sklearn_surrogate-58"><a href="#sklearn_surrogate-58"><span class="linenos">58</span></a>    <span class="n">unique_values</span><span class="p">,</span> <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">vector_second</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="sklearn_surrogate-59"><a href="#sklearn_surrogate-59"><span class="linenos">59</span></a>
-</span><span id="sklearn_surrogate-60"><a href="#sklearn_surrogate-60"><span class="linenos">60</span></a>    <span class="c1"># Establish min support for this type of ranking.</span>
-</span><span id="sklearn_surrogate-61"><a href="#sklearn_surrogate-61"><span class="linenos">61</span></a>    <span class="k">if</span> <span class="n">counts</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">&lt;</span> <span class="nb">len</span><span class="p">(</span><span class="n">unique_values</span><span class="p">)</span> <span class="o">*</span> <span class="p">(</span><span class="mi">2</span><span class="o">**</span><span class="mi">5</span><span class="p">):</span>
-</span><span id="sklearn_surrogate-62"><a href="#sklearn_surrogate-62"><span class="linenos">62</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="sklearn_surrogate-63"><a href="#sklearn_surrogate-63"><span class="linenos">63</span></a>
-</span><span id="sklearn_surrogate-64"><a href="#sklearn_surrogate-64"><span class="linenos">64</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="sklearn_surrogate-65"><a href="#sklearn_surrogate-65"><span class="linenos">65</span></a>        <span class="n">vector_first</span> <span class="o">=</span> <span class="n">transf</span><span class="o">.</span><span class="n">fit_transform</span><span class="p">(</span><span class="n">vector_first</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">))</span>
-</span><span id="sklearn_surrogate-66"><a href="#sklearn_surrogate-66"><span class="linenos">66</span></a>        <span class="n">estimate_feature_importance_list</span> <span class="o">=</span> <span class="n">cross_val_score</span><span class="p">(</span>
-</span><span id="sklearn_surrogate-67"><a href="#sklearn_surrogate-67"><span class="linenos">67</span></a>            <span class="n">clf</span><span class="p">,</span> <span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">,</span> <span class="n">scoring</span><span class="o">=</span><span class="s1">&#39;neg_log_loss&#39;</span><span class="p">,</span> <span class="n">cv</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span>
-</span><span id="sklearn_surrogate-68"><a href="#sklearn_surrogate-68"><span class="linenos">68</span></a>        <span class="p">)</span>
-</span><span id="sklearn_surrogate-69"><a href="#sklearn_surrogate-69"><span class="linenos">69</span></a>
-</span><span id="sklearn_surrogate-70"><a href="#sklearn_surrogate-70"><span class="linenos">70</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="mi">1</span> <span class="o">+</span> \
-</span><span id="sklearn_surrogate-71"><a href="#sklearn_surrogate-71"><span class="linenos">71</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="n">estimate_feature_importance_list</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="sklearn_surrogate-46"><a href="#sklearn_surrogate-46"><span class="linenos">46</span></a><span class="k">def</span> <span class="nf">sklearn_surrogate</span><span class="p">(</span>
+</span><span id="sklearn_surrogate-47"><a href="#sklearn_surrogate-47"><span class="linenos">47</span></a>    <span class="n">vector_first</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">X</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">surrogate_model</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="sklearn_surrogate-48"><a href="#sklearn_surrogate-48"><span class="linenos">48</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
+</span><span id="sklearn_surrogate-49"><a href="#sklearn_surrogate-49"><span class="linenos">49</span></a>
+</span><span id="sklearn_surrogate-50"><a href="#sklearn_surrogate-50"><span class="linenos">50</span></a>    <span class="n">clf</span> <span class="o">=</span> <span class="n">initialize_classifier</span><span class="p">(</span><span class="n">surrogate_model</span><span class="p">)</span>
+</span><span id="sklearn_surrogate-51"><a href="#sklearn_surrogate-51"><span class="linenos">51</span></a>
+</span><span id="sklearn_surrogate-52"><a href="#sklearn_surrogate-52"><span class="linenos">52</span></a>    <span class="n">transf</span> <span class="o">=</span> <span class="n">OneHotEncoder</span><span class="p">()</span>
+</span><span id="sklearn_surrogate-53"><a href="#sklearn_surrogate-53"><span class="linenos">53</span></a>
+</span><span id="sklearn_surrogate-54"><a href="#sklearn_surrogate-54"><span class="linenos">54</span></a>    <span class="c1"># They do not commute, swap if needed</span>
+</span><span id="sklearn_surrogate-55"><a href="#sklearn_surrogate-55"><span class="linenos">55</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">vector_second</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">):</span>
+</span><span id="sklearn_surrogate-56"><a href="#sklearn_surrogate-56"><span class="linenos">56</span></a>        <span class="n">vector_third</span> <span class="o">=</span> <span class="n">vector_second</span>
+</span><span id="sklearn_surrogate-57"><a href="#sklearn_surrogate-57"><span class="linenos">57</span></a>        <span class="n">vector_second</span> <span class="o">=</span> <span class="n">vector_first</span>
+</span><span id="sklearn_surrogate-58"><a href="#sklearn_surrogate-58"><span class="linenos">58</span></a>        <span class="n">vector_first</span> <span class="o">=</span> <span class="n">vector_third</span>
+</span><span id="sklearn_surrogate-59"><a href="#sklearn_surrogate-59"><span class="linenos">59</span></a>        <span class="k">del</span> <span class="n">vector_third</span>
+</span><span id="sklearn_surrogate-60"><a href="#sklearn_surrogate-60"><span class="linenos">60</span></a>
+</span><span id="sklearn_surrogate-61"><a href="#sklearn_surrogate-61"><span class="linenos">61</span></a>    <span class="k">if</span> <span class="n">X</span><span class="o">.</span><span class="n">size</span> <span class="o">&lt;=</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="sklearn_surrogate-62"><a href="#sklearn_surrogate-62"><span class="linenos">62</span></a>        <span class="n">X</span> <span class="o">=</span> <span class="n">vector_first</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="sklearn_surrogate-63"><a href="#sklearn_surrogate-63"><span class="linenos">63</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="sklearn_surrogate-64"><a href="#sklearn_surrogate-64"><span class="linenos">64</span></a>        <span class="n">X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">vector_first</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">)),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="sklearn_surrogate-65"><a href="#sklearn_surrogate-65"><span class="linenos">65</span></a>
+</span><span id="sklearn_surrogate-66"><a href="#sklearn_surrogate-66"><span class="linenos">66</span></a>    <span class="n">X</span> <span class="o">=</span> <span class="n">transf</span><span class="o">.</span><span class="n">fit_transform</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="sklearn_surrogate-67"><a href="#sklearn_surrogate-67"><span class="linenos">67</span></a>    <span class="n">estimate_feature_importance_list</span> <span class="o">=</span> <span class="n">cross_val_score</span><span class="p">(</span>
+</span><span id="sklearn_surrogate-68"><a href="#sklearn_surrogate-68"><span class="linenos">68</span></a>        <span class="n">clf</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">,</span> <span class="n">scoring</span><span class="o">=</span><span class="s1">&#39;neg_log_loss&#39;</span><span class="p">,</span> <span class="n">cv</span><span class="o">=</span><span class="n">num_folds</span><span class="p">,</span>
+</span><span id="sklearn_surrogate-69"><a href="#sklearn_surrogate-69"><span class="linenos">69</span></a>    <span class="p">)</span>
+</span><span id="sklearn_surrogate-70"><a href="#sklearn_surrogate-70"><span class="linenos">70</span></a>    <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="mi">1</span> <span class="o">+</span> \
+</span><span id="sklearn_surrogate-71"><a href="#sklearn_surrogate-71"><span class="linenos">71</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="n">estimate_feature_importance_list</span><span class="p">)</span>
 </span><span id="sklearn_surrogate-72"><a href="#sklearn_surrogate-72"><span class="linenos">72</span></a>
 </span><span id="sklearn_surrogate-73"><a href="#sklearn_surrogate-73"><span class="linenos">73</span></a>    <span class="k">return</span> <span class="n">estimate_feature_importance</span>
 </span></pre></div>
 
 
-
+    
 
                 </section>
                 <section id="numba_mi">
                             <input id="numba_mi-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">numba_mi</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">vector_first</span>, </span><span class="param"><span class="n">vector_second</span>, </span><span class="param"><span class="n">heuristic</span>, </span><span class="param"><span class="n">mi_stratified_sampling_ratio</span></span><span class="return-annotation">):</span></span>
 
@@ -407,13 +436,13 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                 </section>
                 <section id="sklearn_mi_adj">
                             <input id="sklearn_mi_adj-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">sklearn_mi_adj</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">vector_first</span>, </span><span class="param"><span class="n">vector_second</span></span><span class="return-annotation">):</span></span>
 
@@ -430,21 +459,21 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                 </section>
                 <section id="get_importances_estimate_pairwise">
                             <input id="get_importances_estimate_pairwise-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
-        <span class="name">get_importances_estimate_pairwise</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">combination</span>, </span><span class="param"><span class="n">args</span>, </span><span class="param"><span class="n">tmp_df</span></span><span class="return-annotation">):</span></span>
+        <span class="name">get_importances_estimate_pairwise</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">combination</span>, </span><span class="param"><span class="n">reference_model_features</span>, </span><span class="param"><span class="n">args</span>, </span><span class="param"><span class="n">tmp_df</span></span><span class="return-annotation">):</span></span>
 
                 <label class="view-source-button" for="get_importances_estimate_pairwise-view-source"><span>View Source</span></label>
 
     </div>
     <a class="headerlink" href="#get_importances_estimate_pairwise"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="get_importances_estimate_pairwise-101"><a href="#get_importances_estimate_pairwise-101"><span class="linenos">101</span></a><span class="k">def</span> <span class="nf">get_importances_estimate_pairwise</span><span class="p">(</span><span class="n">combination</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">):</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="get_importances_estimate_pairwise-101"><a href="#get_importances_estimate_pairwise-101"><span class="linenos">101</span></a><span class="k">def</span> <span class="nf">get_importances_estimate_pairwise</span><span class="p">(</span><span class="n">combination</span><span class="p">,</span> <span class="n">reference_model_features</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">):</span>
 </span><span id="get_importances_estimate_pairwise-102"><a href="#get_importances_estimate_pairwise-102"><span class="linenos">102</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;A method for parallel importances estimation. As interaction scoring is independent, individual scores can be computed in parallel.&quot;&quot;&quot;</span>
 </span><span id="get_importances_estimate_pairwise-103"><a href="#get_importances_estimate_pairwise-103"><span class="linenos">103</span></a>
 </span><span id="get_importances_estimate_pairwise-104"><a href="#get_importances_estimate_pairwise-104"><span class="linenos">104</span></a>    <span class="n">feature_one</span> <span class="o">=</span> <span class="n">combination</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
@@ -469,32 +498,36 @@ <h1 class="modulename">
 </span><span id="get_importances_estimate_pairwise-123"><a href="#get_importances_estimate_pairwise-123"><span class="linenos">123</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">sklearn_MI</span><span class="p">(</span><span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">)</span>
 </span><span id="get_importances_estimate_pairwise-124"><a href="#get_importances_estimate_pairwise-124"><span class="linenos">124</span></a>
 </span><span id="get_importances_estimate_pairwise-125"><a href="#get_importances_estimate_pairwise-125"><span class="linenos">125</span></a>    <span class="k">elif</span> <span class="s1">&#39;surrogate-&#39;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">:</span>
-</span><span id="get_importances_estimate_pairwise-126"><a href="#get_importances_estimate_pairwise-126"><span class="linenos">126</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">sklearn_surrogate</span><span class="p">(</span>
-</span><span id="get_importances_estimate_pairwise-127"><a href="#get_importances_estimate_pairwise-127"><span class="linenos">127</span></a>            <span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">,</span>
-</span><span id="get_importances_estimate_pairwise-128"><a href="#get_importances_estimate_pairwise-128"><span class="linenos">128</span></a>        <span class="p">)</span>
+</span><span id="get_importances_estimate_pairwise-126"><a href="#get_importances_estimate_pairwise-126"><span class="linenos">126</span></a>        <span class="n">X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">float</span><span class="p">)</span>
+</span><span id="get_importances_estimate_pairwise-127"><a href="#get_importances_estimate_pairwise-127"><span class="linenos">127</span></a>        <span class="k">if</span> <span class="n">is_prior_heuristic</span><span class="p">(</span><span class="n">args</span><span class="p">)</span> <span class="ow">and</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">reference_model_features</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">):</span>
+</span><span id="get_importances_estimate_pairwise-128"><a href="#get_importances_estimate_pairwise-128"><span class="linenos">128</span></a>            <span class="n">X</span> <span class="o">=</span> <span class="n">tmp_df</span><span class="p">[</span><span class="n">reference_model_features</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
 </span><span id="get_importances_estimate_pairwise-129"><a href="#get_importances_estimate_pairwise-129"><span class="linenos">129</span></a>
-</span><span id="get_importances_estimate_pairwise-130"><a href="#get_importances_estimate_pairwise-130"><span class="linenos">130</span></a>    <span class="k">elif</span> <span class="s1">&#39;MI-numba&#39;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">:</span>
-</span><span id="get_importances_estimate_pairwise-131"><a href="#get_importances_estimate_pairwise-131"><span class="linenos">131</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">numba_mi</span><span class="p">(</span>
-</span><span id="get_importances_estimate_pairwise-132"><a href="#get_importances_estimate_pairwise-132"><span class="linenos">132</span></a>            <span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">mi_stratified_sampling_ratio</span><span class="p">,</span>
-</span><span id="get_importances_estimate_pairwise-133"><a href="#get_importances_estimate_pairwise-133"><span class="linenos">133</span></a>        <span class="p">)</span>
-</span><span id="get_importances_estimate_pairwise-134"><a href="#get_importances_estimate_pairwise-134"><span class="linenos">134</span></a>
-</span><span id="get_importances_estimate_pairwise-135"><a href="#get_importances_estimate_pairwise-135"><span class="linenos">135</span></a>    <span class="k">elif</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">==</span> <span class="s1">&#39;AMI&#39;</span><span class="p">:</span>
-</span><span id="get_importances_estimate_pairwise-136"><a href="#get_importances_estimate_pairwise-136"><span class="linenos">136</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">sklearn_mi_adj</span><span class="p">(</span>
-</span><span id="get_importances_estimate_pairwise-137"><a href="#get_importances_estimate_pairwise-137"><span class="linenos">137</span></a>            <span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">,</span>
-</span><span id="get_importances_estimate_pairwise-138"><a href="#get_importances_estimate_pairwise-138"><span class="linenos">138</span></a>        <span class="p">)</span>
-</span><span id="get_importances_estimate_pairwise-139"><a href="#get_importances_estimate_pairwise-139"><span class="linenos">139</span></a>
-</span><span id="get_importances_estimate_pairwise-140"><a href="#get_importances_estimate_pairwise-140"><span class="linenos">140</span></a>    <span class="k">elif</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">==</span> <span class="s1">&#39;correlation-Pearson&#39;</span><span class="p">:</span>
-</span><span id="get_importances_estimate_pairwise-141"><a href="#get_importances_estimate_pairwise-141"><span class="linenos">141</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">pearsonr</span><span class="p">(</span><span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="get_importances_estimate_pairwise-142"><a href="#get_importances_estimate_pairwise-142"><span class="linenos">142</span></a>
-</span><span id="get_importances_estimate_pairwise-143"><a href="#get_importances_estimate_pairwise-143"><span class="linenos">143</span></a>    <span class="k">elif</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">==</span> <span class="s1">&#39;Constant&#39;</span><span class="p">:</span>
-</span><span id="get_importances_estimate_pairwise-144"><a href="#get_importances_estimate_pairwise-144"><span class="linenos">144</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="mf">0.0</span>
-</span><span id="get_importances_estimate_pairwise-145"><a href="#get_importances_estimate_pairwise-145"><span class="linenos">145</span></a>
-</span><span id="get_importances_estimate_pairwise-146"><a href="#get_importances_estimate_pairwise-146"><span class="linenos">146</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="get_importances_estimate_pairwise-147"><a href="#get_importances_estimate_pairwise-147"><span class="linenos">147</span></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-</span><span id="get_importances_estimate_pairwise-148"><a href="#get_importances_estimate_pairwise-148"><span class="linenos">148</span></a>            <span class="s1">&#39;Please select one of the possible heuristics (MI, chi2)&#39;</span><span class="p">,</span>
-</span><span id="get_importances_estimate_pairwise-149"><a href="#get_importances_estimate_pairwise-149"><span class="linenos">149</span></a>        <span class="p">)</span>
-</span><span id="get_importances_estimate_pairwise-150"><a href="#get_importances_estimate_pairwise-150"><span class="linenos">150</span></a>
-</span><span id="get_importances_estimate_pairwise-151"><a href="#get_importances_estimate_pairwise-151"><span class="linenos">151</span></a>    <span class="k">return</span> <span class="p">(</span><span class="n">feature_one</span><span class="p">,</span> <span class="n">feature_two</span><span class="p">,</span> <span class="n">estimate_feature_importance</span><span class="p">)</span>
+</span><span id="get_importances_estimate_pairwise-130"><a href="#get_importances_estimate_pairwise-130"><span class="linenos">130</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">sklearn_surrogate</span><span class="p">(</span>
+</span><span id="get_importances_estimate_pairwise-131"><a href="#get_importances_estimate_pairwise-131"><span class="linenos">131</span></a>            <span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">,</span>
+</span><span id="get_importances_estimate_pairwise-132"><a href="#get_importances_estimate_pairwise-132"><span class="linenos">132</span></a>        <span class="p">)</span>
+</span><span id="get_importances_estimate_pairwise-133"><a href="#get_importances_estimate_pairwise-133"><span class="linenos">133</span></a>
+</span><span id="get_importances_estimate_pairwise-134"><a href="#get_importances_estimate_pairwise-134"><span class="linenos">134</span></a>    <span class="k">elif</span> <span class="s1">&#39;MI-numba&#39;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">:</span>
+</span><span id="get_importances_estimate_pairwise-135"><a href="#get_importances_estimate_pairwise-135"><span class="linenos">135</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">numba_mi</span><span class="p">(</span>
+</span><span id="get_importances_estimate_pairwise-136"><a href="#get_importances_estimate_pairwise-136"><span class="linenos">136</span></a>            <span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">mi_stratified_sampling_ratio</span><span class="p">,</span>
+</span><span id="get_importances_estimate_pairwise-137"><a href="#get_importances_estimate_pairwise-137"><span class="linenos">137</span></a>        <span class="p">)</span>
+</span><span id="get_importances_estimate_pairwise-138"><a href="#get_importances_estimate_pairwise-138"><span class="linenos">138</span></a>
+</span><span id="get_importances_estimate_pairwise-139"><a href="#get_importances_estimate_pairwise-139"><span class="linenos">139</span></a>    <span class="k">elif</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">==</span> <span class="s1">&#39;AMI&#39;</span><span class="p">:</span>
+</span><span id="get_importances_estimate_pairwise-140"><a href="#get_importances_estimate_pairwise-140"><span class="linenos">140</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">sklearn_mi_adj</span><span class="p">(</span>
+</span><span id="get_importances_estimate_pairwise-141"><a href="#get_importances_estimate_pairwise-141"><span class="linenos">141</span></a>            <span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">,</span>
+</span><span id="get_importances_estimate_pairwise-142"><a href="#get_importances_estimate_pairwise-142"><span class="linenos">142</span></a>        <span class="p">)</span>
+</span><span id="get_importances_estimate_pairwise-143"><a href="#get_importances_estimate_pairwise-143"><span class="linenos">143</span></a>
+</span><span id="get_importances_estimate_pairwise-144"><a href="#get_importances_estimate_pairwise-144"><span class="linenos">144</span></a>    <span class="k">elif</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">==</span> <span class="s1">&#39;correlation-Pearson&#39;</span><span class="p">:</span>
+</span><span id="get_importances_estimate_pairwise-145"><a href="#get_importances_estimate_pairwise-145"><span class="linenos">145</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="n">pearsonr</span><span class="p">(</span><span class="n">vector_first</span><span class="p">,</span> <span class="n">vector_second</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="get_importances_estimate_pairwise-146"><a href="#get_importances_estimate_pairwise-146"><span class="linenos">146</span></a>
+</span><span id="get_importances_estimate_pairwise-147"><a href="#get_importances_estimate_pairwise-147"><span class="linenos">147</span></a>    <span class="k">elif</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">==</span> <span class="s1">&#39;Constant&#39;</span><span class="p">:</span>
+</span><span id="get_importances_estimate_pairwise-148"><a href="#get_importances_estimate_pairwise-148"><span class="linenos">148</span></a>        <span class="n">estimate_feature_importance</span> <span class="o">=</span> <span class="mf">0.0</span>
+</span><span id="get_importances_estimate_pairwise-149"><a href="#get_importances_estimate_pairwise-149"><span class="linenos">149</span></a>
+</span><span id="get_importances_estimate_pairwise-150"><a href="#get_importances_estimate_pairwise-150"><span class="linenos">150</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="get_importances_estimate_pairwise-151"><a href="#get_importances_estimate_pairwise-151"><span class="linenos">151</span></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+</span><span id="get_importances_estimate_pairwise-152"><a href="#get_importances_estimate_pairwise-152"><span class="linenos">152</span></a>            <span class="s1">&#39;Please select one of the possible heuristics (MI, chi2)&#39;</span><span class="p">,</span>
+</span><span id="get_importances_estimate_pairwise-153"><a href="#get_importances_estimate_pairwise-153"><span class="linenos">153</span></a>        <span class="p">)</span>
+</span><span id="get_importances_estimate_pairwise-154"><a href="#get_importances_estimate_pairwise-154"><span class="linenos">154</span></a>
+</span><span id="get_importances_estimate_pairwise-155"><a href="#get_importances_estimate_pairwise-155"><span class="linenos">155</span></a>    <span class="k">return</span> <span class="p">(</span><span class="n">feature_one</span><span class="p">,</span> <span class="n">feature_two</span><span class="p">,</span> <span class="n">estimate_feature_importance</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -506,7 +539,7 @@ <h1 class="modulename">
                 <section id="rank_features_3MR">
                             <input id="rank_features_3MR-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">rank_features_3MR</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">relevance_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">]</span>,</span><span class="param">	<span class="n">redundancy_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">,</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">],</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">]</span>,</span><span class="param">	<span class="n">relational_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">,</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">],</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">]</span>,</span><span class="param">	<span class="n">strategy</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;median&#39;</span>,</span><span class="param">	<span class="n">alpha</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span>,</span><span class="param">	<span class="n">beta</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span></span><span class="return-annotation">) -> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>:</span></span>
 
@@ -514,73 +547,73 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#rank_features_3MR"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="rank_features_3MR-154"><a href="#rank_features_3MR-154"><span class="linenos">154</span></a><span class="k">def</span> <span class="nf">rank_features_3MR</span><span class="p">(</span>
-</span><span id="rank_features_3MR-155"><a href="#rank_features_3MR-155"><span class="linenos">155</span></a>    <span class="n">relevance_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">],</span>
-</span><span id="rank_features_3MR-156"><a href="#rank_features_3MR-156"><span class="linenos">156</span></a>    <span class="n">redundancy_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="n">Any</span><span class="p">],</span>
-</span><span id="rank_features_3MR-157"><a href="#rank_features_3MR-157"><span class="linenos">157</span></a>    <span class="n">relational_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="n">Any</span><span class="p">],</span>
-</span><span id="rank_features_3MR-158"><a href="#rank_features_3MR-158"><span class="linenos">158</span></a>    <span class="n">strategy</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;median&#39;</span><span class="p">,</span>
-</span><span id="rank_features_3MR-159"><a href="#rank_features_3MR-159"><span class="linenos">159</span></a>    <span class="n">alpha</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
-</span><span id="rank_features_3MR-160"><a href="#rank_features_3MR-160"><span class="linenos">160</span></a>    <span class="n">beta</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
-</span><span id="rank_features_3MR-161"><a href="#rank_features_3MR-161"><span class="linenos">161</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="rank_features_3MR-162"><a href="#rank_features_3MR-162"><span class="linenos">162</span></a>    <span class="n">all_features</span> <span class="o">=</span> <span class="n">relevance_dict</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
-</span><span id="rank_features_3MR-163"><a href="#rank_features_3MR-163"><span class="linenos">163</span></a>    <span class="n">most_important_feature</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span>
-</span><span id="rank_features_3MR-164"><a href="#rank_features_3MR-164"><span class="linenos">164</span></a>        <span class="n">relevance_dict</span><span class="o">.</span><span class="n">items</span><span class="p">(),</span> <span class="n">key</span><span class="o">=</span><span class="n">operator</span><span class="o">.</span><span class="n">itemgetter</span><span class="p">(</span><span class="mi">1</span><span class="p">),</span>
-</span><span id="rank_features_3MR-165"><a href="#rank_features_3MR-165"><span class="linenos">165</span></a>    <span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="rank_features_3MR-166"><a href="#rank_features_3MR-166"><span class="linenos">166</span></a>    <span class="n">ranked_features</span> <span class="o">=</span> <span class="p">[</span><span class="n">most_important_feature</span><span class="p">]</span>
-</span><span id="rank_features_3MR-167"><a href="#rank_features_3MR-167"><span class="linenos">167</span></a>
-</span><span id="rank_features_3MR-168"><a href="#rank_features_3MR-168"><span class="linenos">168</span></a>    <span class="k">def</span> <span class="nf">calc_higher_order</span><span class="p">(</span><span class="n">feature</span><span class="p">,</span> <span class="n">is_redundancy</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-</span><span id="rank_features_3MR-169"><a href="#rank_features_3MR-169"><span class="linenos">169</span></a>        <span class="n">values</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="rank_features_3MR-170"><a href="#rank_features_3MR-170"><span class="linenos">170</span></a>        <span class="k">for</span> <span class="n">feat</span> <span class="ow">in</span> <span class="n">ranked_features</span><span class="p">:</span>
-</span><span id="rank_features_3MR-171"><a href="#rank_features_3MR-171"><span class="linenos">171</span></a>            <span class="n">interaction_tuple</span> <span class="o">=</span> <span class="p">(</span><span class="n">feat</span><span class="p">,</span> <span class="n">feature</span><span class="p">)</span>
-</span><span id="rank_features_3MR-172"><a href="#rank_features_3MR-172"><span class="linenos">172</span></a>            <span class="k">if</span> <span class="n">is_redundancy</span><span class="p">:</span>
-</span><span id="rank_features_3MR-173"><a href="#rank_features_3MR-173"><span class="linenos">173</span></a>                <span class="k">if</span> <span class="n">interaction_tuple</span> <span class="ow">in</span> <span class="n">redundancy_dict</span><span class="p">:</span>
-</span><span id="rank_features_3MR-174"><a href="#rank_features_3MR-174"><span class="linenos">174</span></a>                    <span class="n">values</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">redundancy_dict</span><span class="p">[</span><span class="n">interaction_tuple</span><span class="p">])</span>
-</span><span id="rank_features_3MR-175"><a href="#rank_features_3MR-175"><span class="linenos">175</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="rank_features_3MR-176"><a href="#rank_features_3MR-176"><span class="linenos">176</span></a>                    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Not accounting for redundancy tuple </span><span class="si">{}</span><span class="s1"> - please increase the --combination_number_upper_bound for beter coverage of interactions/redundancies.&#39;</span><span class="p">)</span>
-</span><span id="rank_features_3MR-177"><a href="#rank_features_3MR-177"><span class="linenos">177</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="rank_features_3MR-178"><a href="#rank_features_3MR-178"><span class="linenos">178</span></a>                <span class="k">if</span> <span class="n">interaction_tuple</span> <span class="ow">in</span> <span class="n">relational_dict</span><span class="p">:</span>
-</span><span id="rank_features_3MR-179"><a href="#rank_features_3MR-179"><span class="linenos">179</span></a>                    <span class="n">values</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">relational_dict</span><span class="p">[</span><span class="n">interaction_tuple</span><span class="p">])</span>
-</span><span id="rank_features_3MR-180"><a href="#rank_features_3MR-180"><span class="linenos">180</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="rank_features_3MR-181"><a href="#rank_features_3MR-181"><span class="linenos">181</span></a>                    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Not accounting for interaction tuple </span><span class="si">{}</span><span class="s1"> - please increase the --combination_number_upper_bound for beter coverage of interactions/redundancies.&#39;</span><span class="p">)</span>
-</span><span id="rank_features_3MR-182"><a href="#rank_features_3MR-182"><span class="linenos">182</span></a>
-</span><span id="rank_features_3MR-183"><a href="#rank_features_3MR-183"><span class="linenos">183</span></a>        <span class="k">if</span> <span class="n">strategy</span> <span class="o">==</span> <span class="s1">&#39;sum&#39;</span><span class="p">:</span>
-</span><span id="rank_features_3MR-184"><a href="#rank_features_3MR-184"><span class="linenos">184</span></a>            <span class="k">return</span> <span class="nb">sum</span><span class="p">(</span><span class="n">values</span><span class="p">)</span>
-</span><span id="rank_features_3MR-185"><a href="#rank_features_3MR-185"><span class="linenos">185</span></a>        <span class="k">if</span> <span class="n">strategy</span> <span class="o">==</span> <span class="s1">&#39;mean&#39;</span><span class="p">:</span>
-</span><span id="rank_features_3MR-186"><a href="#rank_features_3MR-186"><span class="linenos">186</span></a>            <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">values</span><span class="p">)</span>
-</span><span id="rank_features_3MR-187"><a href="#rank_features_3MR-187"><span class="linenos">187</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="n">values</span><span class="p">)</span>
-</span><span id="rank_features_3MR-188"><a href="#rank_features_3MR-188"><span class="linenos">188</span></a>
-</span><span id="rank_features_3MR-189"><a href="#rank_features_3MR-189"><span class="linenos">189</span></a>    <span class="k">while</span> <span class="nb">len</span><span class="p">(</span><span class="n">ranked_features</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">all_features</span><span class="p">):</span>
-</span><span id="rank_features_3MR-190"><a href="#rank_features_3MR-190"><span class="linenos">190</span></a>        <span class="n">top_importance</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="rank_features_3MR-191"><a href="#rank_features_3MR-191"><span class="linenos">191</span></a>        <span class="n">most_important_feature</span> <span class="o">=</span> <span class="s1">&#39;&#39;</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="rank_features_3MR-158"><a href="#rank_features_3MR-158"><span class="linenos">158</span></a><span class="k">def</span> <span class="nf">rank_features_3MR</span><span class="p">(</span>
+</span><span id="rank_features_3MR-159"><a href="#rank_features_3MR-159"><span class="linenos">159</span></a>    <span class="n">relevance_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">],</span>
+</span><span id="rank_features_3MR-160"><a href="#rank_features_3MR-160"><span class="linenos">160</span></a>    <span class="n">redundancy_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="n">Any</span><span class="p">],</span>
+</span><span id="rank_features_3MR-161"><a href="#rank_features_3MR-161"><span class="linenos">161</span></a>    <span class="n">relational_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="n">Any</span><span class="p">],</span>
+</span><span id="rank_features_3MR-162"><a href="#rank_features_3MR-162"><span class="linenos">162</span></a>    <span class="n">strategy</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;median&#39;</span><span class="p">,</span>
+</span><span id="rank_features_3MR-163"><a href="#rank_features_3MR-163"><span class="linenos">163</span></a>    <span class="n">alpha</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="rank_features_3MR-164"><a href="#rank_features_3MR-164"><span class="linenos">164</span></a>    <span class="n">beta</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="rank_features_3MR-165"><a href="#rank_features_3MR-165"><span class="linenos">165</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="rank_features_3MR-166"><a href="#rank_features_3MR-166"><span class="linenos">166</span></a>    <span class="n">all_features</span> <span class="o">=</span> <span class="n">relevance_dict</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="rank_features_3MR-167"><a href="#rank_features_3MR-167"><span class="linenos">167</span></a>    <span class="n">most_important_feature</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span>
+</span><span id="rank_features_3MR-168"><a href="#rank_features_3MR-168"><span class="linenos">168</span></a>        <span class="n">relevance_dict</span><span class="o">.</span><span class="n">items</span><span class="p">(),</span> <span class="n">key</span><span class="o">=</span><span class="n">operator</span><span class="o">.</span><span class="n">itemgetter</span><span class="p">(</span><span class="mi">1</span><span class="p">),</span>
+</span><span id="rank_features_3MR-169"><a href="#rank_features_3MR-169"><span class="linenos">169</span></a>    <span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="rank_features_3MR-170"><a href="#rank_features_3MR-170"><span class="linenos">170</span></a>    <span class="n">ranked_features</span> <span class="o">=</span> <span class="p">[</span><span class="n">most_important_feature</span><span class="p">]</span>
+</span><span id="rank_features_3MR-171"><a href="#rank_features_3MR-171"><span class="linenos">171</span></a>
+</span><span id="rank_features_3MR-172"><a href="#rank_features_3MR-172"><span class="linenos">172</span></a>    <span class="k">def</span> <span class="nf">calc_higher_order</span><span class="p">(</span><span class="n">feature</span><span class="p">,</span> <span class="n">is_redundancy</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
+</span><span id="rank_features_3MR-173"><a href="#rank_features_3MR-173"><span class="linenos">173</span></a>        <span class="n">values</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="rank_features_3MR-174"><a href="#rank_features_3MR-174"><span class="linenos">174</span></a>        <span class="k">for</span> <span class="n">feat</span> <span class="ow">in</span> <span class="n">ranked_features</span><span class="p">:</span>
+</span><span id="rank_features_3MR-175"><a href="#rank_features_3MR-175"><span class="linenos">175</span></a>            <span class="n">interaction_tuple</span> <span class="o">=</span> <span class="p">(</span><span class="n">feat</span><span class="p">,</span> <span class="n">feature</span><span class="p">)</span>
+</span><span id="rank_features_3MR-176"><a href="#rank_features_3MR-176"><span class="linenos">176</span></a>            <span class="k">if</span> <span class="n">is_redundancy</span><span class="p">:</span>
+</span><span id="rank_features_3MR-177"><a href="#rank_features_3MR-177"><span class="linenos">177</span></a>                <span class="k">if</span> <span class="n">interaction_tuple</span> <span class="ow">in</span> <span class="n">redundancy_dict</span><span class="p">:</span>
+</span><span id="rank_features_3MR-178"><a href="#rank_features_3MR-178"><span class="linenos">178</span></a>                    <span class="n">values</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">redundancy_dict</span><span class="p">[</span><span class="n">interaction_tuple</span><span class="p">])</span>
+</span><span id="rank_features_3MR-179"><a href="#rank_features_3MR-179"><span class="linenos">179</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="rank_features_3MR-180"><a href="#rank_features_3MR-180"><span class="linenos">180</span></a>                    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Not accounting for redundancy tuple </span><span class="si">{}</span><span class="s1"> - please increase the --combination_number_upper_bound for beter coverage of interactions/redundancies.&#39;</span><span class="p">)</span>
+</span><span id="rank_features_3MR-181"><a href="#rank_features_3MR-181"><span class="linenos">181</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="rank_features_3MR-182"><a href="#rank_features_3MR-182"><span class="linenos">182</span></a>                <span class="k">if</span> <span class="n">interaction_tuple</span> <span class="ow">in</span> <span class="n">relational_dict</span><span class="p">:</span>
+</span><span id="rank_features_3MR-183"><a href="#rank_features_3MR-183"><span class="linenos">183</span></a>                    <span class="n">values</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">relational_dict</span><span class="p">[</span><span class="n">interaction_tuple</span><span class="p">])</span>
+</span><span id="rank_features_3MR-184"><a href="#rank_features_3MR-184"><span class="linenos">184</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="rank_features_3MR-185"><a href="#rank_features_3MR-185"><span class="linenos">185</span></a>                    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Not accounting for interaction tuple </span><span class="si">{}</span><span class="s1"> - please increase the --combination_number_upper_bound for beter coverage of interactions/redundancies.&#39;</span><span class="p">)</span>
+</span><span id="rank_features_3MR-186"><a href="#rank_features_3MR-186"><span class="linenos">186</span></a>
+</span><span id="rank_features_3MR-187"><a href="#rank_features_3MR-187"><span class="linenos">187</span></a>        <span class="k">if</span> <span class="n">strategy</span> <span class="o">==</span> <span class="s1">&#39;sum&#39;</span><span class="p">:</span>
+</span><span id="rank_features_3MR-188"><a href="#rank_features_3MR-188"><span class="linenos">188</span></a>            <span class="k">return</span> <span class="nb">sum</span><span class="p">(</span><span class="n">values</span><span class="p">)</span>
+</span><span id="rank_features_3MR-189"><a href="#rank_features_3MR-189"><span class="linenos">189</span></a>        <span class="k">if</span> <span class="n">strategy</span> <span class="o">==</span> <span class="s1">&#39;mean&#39;</span><span class="p">:</span>
+</span><span id="rank_features_3MR-190"><a href="#rank_features_3MR-190"><span class="linenos">190</span></a>            <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">values</span><span class="p">)</span>
+</span><span id="rank_features_3MR-191"><a href="#rank_features_3MR-191"><span class="linenos">191</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="n">values</span><span class="p">)</span>
 </span><span id="rank_features_3MR-192"><a href="#rank_features_3MR-192"><span class="linenos">192</span></a>
-</span><span id="rank_features_3MR-193"><a href="#rank_features_3MR-193"><span class="linenos">193</span></a>        <span class="k">for</span> <span class="n">ind</span><span class="p">,</span> <span class="n">feat</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">all_features</span><span class="p">)</span> <span class="o">-</span> <span class="nb">set</span><span class="p">(</span><span class="n">ranked_features</span><span class="p">)):</span>
-</span><span id="rank_features_3MR-194"><a href="#rank_features_3MR-194"><span class="linenos">194</span></a>            <span class="n">feature_redundancy</span> <span class="o">=</span> <span class="n">calc_higher_order</span><span class="p">(</span><span class="n">feat</span><span class="p">)</span>
-</span><span id="rank_features_3MR-195"><a href="#rank_features_3MR-195"><span class="linenos">195</span></a>            <span class="n">feature_relation</span> <span class="o">=</span> <span class="n">calc_higher_order</span><span class="p">(</span><span class="n">feat</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
-</span><span id="rank_features_3MR-196"><a href="#rank_features_3MR-196"><span class="linenos">196</span></a>            <span class="n">feature_relevance</span> <span class="o">=</span> <span class="n">relevance_dict</span><span class="p">[</span><span class="n">feat</span><span class="p">]</span>
-</span><span id="rank_features_3MR-197"><a href="#rank_features_3MR-197"><span class="linenos">197</span></a>            <span class="n">importance</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="rank_features_3MR-198"><a href="#rank_features_3MR-198"><span class="linenos">198</span></a>                <span class="n">feature_relevance</span> <span class="o">-</span> <span class="n">alpha</span> <span class="o">*</span> <span class="n">feature_redundancy</span> <span class="o">+</span> <span class="n">beta</span> <span class="o">*</span> <span class="n">feature_relation</span>
-</span><span id="rank_features_3MR-199"><a href="#rank_features_3MR-199"><span class="linenos">199</span></a>            <span class="p">)</span>
-</span><span id="rank_features_3MR-200"><a href="#rank_features_3MR-200"><span class="linenos">200</span></a>
-</span><span id="rank_features_3MR-201"><a href="#rank_features_3MR-201"><span class="linenos">201</span></a>            <span class="k">if</span> <span class="p">(</span><span class="n">importance</span> <span class="o">&gt;</span> <span class="n">top_importance</span><span class="p">)</span> <span class="ow">or</span> <span class="p">(</span><span class="n">ind</span> <span class="o">==</span> <span class="mi">0</span><span class="p">):</span>
-</span><span id="rank_features_3MR-202"><a href="#rank_features_3MR-202"><span class="linenos">202</span></a>                <span class="n">top_importance</span> <span class="o">=</span> <span class="n">importance</span>
-</span><span id="rank_features_3MR-203"><a href="#rank_features_3MR-203"><span class="linenos">203</span></a>                <span class="n">most_important_feature</span> <span class="o">=</span> <span class="n">feat</span>
-</span><span id="rank_features_3MR-204"><a href="#rank_features_3MR-204"><span class="linenos">204</span></a>        <span class="n">ranked_features</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">most_important_feature</span><span class="p">)</span>
-</span><span id="rank_features_3MR-205"><a href="#rank_features_3MR-205"><span class="linenos">205</span></a>    <span class="k">return</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span>
-</span><span id="rank_features_3MR-206"><a href="#rank_features_3MR-206"><span class="linenos">206</span></a>        <span class="p">{</span>
-</span><span id="rank_features_3MR-207"><a href="#rank_features_3MR-207"><span class="linenos">207</span></a>            <span class="s1">&#39;Feature&#39;</span><span class="p">:</span> <span class="n">ranked_features</span><span class="p">,</span>
-</span><span id="rank_features_3MR-208"><a href="#rank_features_3MR-208"><span class="linenos">208</span></a>            <span class="s1">&#39;3mr_ranking&#39;</span><span class="p">:</span> <span class="nb">list</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">ranked_features</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)),</span>
-</span><span id="rank_features_3MR-209"><a href="#rank_features_3MR-209"><span class="linenos">209</span></a>        <span class="p">},</span>
-</span><span id="rank_features_3MR-210"><a href="#rank_features_3MR-210"><span class="linenos">210</span></a>    <span class="p">)</span>
+</span><span id="rank_features_3MR-193"><a href="#rank_features_3MR-193"><span class="linenos">193</span></a>    <span class="k">while</span> <span class="nb">len</span><span class="p">(</span><span class="n">ranked_features</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">all_features</span><span class="p">):</span>
+</span><span id="rank_features_3MR-194"><a href="#rank_features_3MR-194"><span class="linenos">194</span></a>        <span class="n">top_importance</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="rank_features_3MR-195"><a href="#rank_features_3MR-195"><span class="linenos">195</span></a>        <span class="n">most_important_feature</span> <span class="o">=</span> <span class="s1">&#39;&#39;</span>
+</span><span id="rank_features_3MR-196"><a href="#rank_features_3MR-196"><span class="linenos">196</span></a>
+</span><span id="rank_features_3MR-197"><a href="#rank_features_3MR-197"><span class="linenos">197</span></a>        <span class="k">for</span> <span class="n">ind</span><span class="p">,</span> <span class="n">feat</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">all_features</span><span class="p">)</span> <span class="o">-</span> <span class="nb">set</span><span class="p">(</span><span class="n">ranked_features</span><span class="p">)):</span>
+</span><span id="rank_features_3MR-198"><a href="#rank_features_3MR-198"><span class="linenos">198</span></a>            <span class="n">feature_redundancy</span> <span class="o">=</span> <span class="n">calc_higher_order</span><span class="p">(</span><span class="n">feat</span><span class="p">)</span>
+</span><span id="rank_features_3MR-199"><a href="#rank_features_3MR-199"><span class="linenos">199</span></a>            <span class="n">feature_relation</span> <span class="o">=</span> <span class="n">calc_higher_order</span><span class="p">(</span><span class="n">feat</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+</span><span id="rank_features_3MR-200"><a href="#rank_features_3MR-200"><span class="linenos">200</span></a>            <span class="n">feature_relevance</span> <span class="o">=</span> <span class="n">relevance_dict</span><span class="p">[</span><span class="n">feat</span><span class="p">]</span>
+</span><span id="rank_features_3MR-201"><a href="#rank_features_3MR-201"><span class="linenos">201</span></a>            <span class="n">importance</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="rank_features_3MR-202"><a href="#rank_features_3MR-202"><span class="linenos">202</span></a>                <span class="n">feature_relevance</span> <span class="o">-</span> <span class="n">alpha</span> <span class="o">*</span> <span class="n">feature_redundancy</span> <span class="o">+</span> <span class="n">beta</span> <span class="o">*</span> <span class="n">feature_relation</span>
+</span><span id="rank_features_3MR-203"><a href="#rank_features_3MR-203"><span class="linenos">203</span></a>            <span class="p">)</span>
+</span><span id="rank_features_3MR-204"><a href="#rank_features_3MR-204"><span class="linenos">204</span></a>
+</span><span id="rank_features_3MR-205"><a href="#rank_features_3MR-205"><span class="linenos">205</span></a>            <span class="k">if</span> <span class="p">(</span><span class="n">importance</span> <span class="o">&gt;</span> <span class="n">top_importance</span><span class="p">)</span> <span class="ow">or</span> <span class="p">(</span><span class="n">ind</span> <span class="o">==</span> <span class="mi">0</span><span class="p">):</span>
+</span><span id="rank_features_3MR-206"><a href="#rank_features_3MR-206"><span class="linenos">206</span></a>                <span class="n">top_importance</span> <span class="o">=</span> <span class="n">importance</span>
+</span><span id="rank_features_3MR-207"><a href="#rank_features_3MR-207"><span class="linenos">207</span></a>                <span class="n">most_important_feature</span> <span class="o">=</span> <span class="n">feat</span>
+</span><span id="rank_features_3MR-208"><a href="#rank_features_3MR-208"><span class="linenos">208</span></a>        <span class="n">ranked_features</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">most_important_feature</span><span class="p">)</span>
+</span><span id="rank_features_3MR-209"><a href="#rank_features_3MR-209"><span class="linenos">209</span></a>    <span class="k">return</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span>
+</span><span id="rank_features_3MR-210"><a href="#rank_features_3MR-210"><span class="linenos">210</span></a>        <span class="p">{</span>
+</span><span id="rank_features_3MR-211"><a href="#rank_features_3MR-211"><span class="linenos">211</span></a>            <span class="s1">&#39;Feature&#39;</span><span class="p">:</span> <span class="n">ranked_features</span><span class="p">,</span>
+</span><span id="rank_features_3MR-212"><a href="#rank_features_3MR-212"><span class="linenos">212</span></a>            <span class="s1">&#39;3mr_ranking&#39;</span><span class="p">:</span> <span class="nb">list</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">ranked_features</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)),</span>
+</span><span id="rank_features_3MR-213"><a href="#rank_features_3MR-213"><span class="linenos">213</span></a>        <span class="p">},</span>
+</span><span id="rank_features_3MR-214"><a href="#rank_features_3MR-214"><span class="linenos">214</span></a>    <span class="p">)</span>
 </span></pre></div>
 
 
-
+    
 
                 </section>
                 <section id="get_importances_estimate_nonmyopic">
                             <input id="get_importances_estimate_nonmyopic-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">get_importances_estimate_nonmyopic</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">args</span><span class="p">:</span> <span class="n">Any</span>, </span><span class="param"><span class="n">tmp_df</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span></span><span class="return-annotation">):</span></span>
 
@@ -588,14 +621,41 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#get_importances_estimate_nonmyopic"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="get_importances_estimate_nonmyopic-213"><a href="#get_importances_estimate_nonmyopic-213"><span class="linenos">213</span></a><span class="k">def</span> <span class="nf">get_importances_estimate_nonmyopic</span><span class="p">(</span><span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">):</span>
-</span><span id="get_importances_estimate_nonmyopic-214"><a href="#get_importances_estimate_nonmyopic-214"><span class="linenos">214</span></a>    <span class="c1"># TODO - nonmyopic algorithms - tmp_df \ args.label vs. label</span>
-</span><span id="get_importances_estimate_nonmyopic-215"><a href="#get_importances_estimate_nonmyopic-215"><span class="linenos">215</span></a>    <span class="c1"># TODO - this is to be executed directly on df - no need for parallel kernel(s)</span>
-</span><span id="get_importances_estimate_nonmyopic-216"><a href="#get_importances_estimate_nonmyopic-216"><span class="linenos">216</span></a>    <span class="k">pass</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="get_importances_estimate_nonmyopic-217"><a href="#get_importances_estimate_nonmyopic-217"><span class="linenos">217</span></a><span class="k">def</span> <span class="nf">get_importances_estimate_nonmyopic</span><span class="p">(</span><span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">):</span>
+</span><span id="get_importances_estimate_nonmyopic-218"><a href="#get_importances_estimate_nonmyopic-218"><span class="linenos">218</span></a>    <span class="c1"># TODO - nonmyopic algorithms - tmp_df \ args.label vs. label</span>
+</span><span id="get_importances_estimate_nonmyopic-219"><a href="#get_importances_estimate_nonmyopic-219"><span class="linenos">219</span></a>    <span class="c1"># TODO - this is to be executed directly on df - no need for parallel kernel(s)</span>
+</span><span id="get_importances_estimate_nonmyopic-220"><a href="#get_importances_estimate_nonmyopic-220"><span class="linenos">220</span></a>    <span class="k">pass</span>
 </span></pre></div>
 
 
+    
+
+                </section>
+                <section id="initialize_classifier">
+                            <input id="initialize_classifier-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">initialize_classifier</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">surrogate_model</span><span class="p">:</span> <span class="nb">str</span></span><span class="return-annotation">):</span></span>
+
+                <label class="view-source-button" for="initialize_classifier-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#initialize_classifier"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="initialize_classifier-223"><a href="#initialize_classifier-223"><span class="linenos">223</span></a><span class="k">def</span> <span class="nf">initialize_classifier</span><span class="p">(</span><span class="n">surrogate_model</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span>
+</span><span id="initialize_classifier-224"><a href="#initialize_classifier-224"><span class="linenos">224</span></a>    <span class="k">if</span> <span class="s1">&#39;surrogate-LR&#39;</span> <span class="ow">in</span> <span class="n">surrogate_model</span><span class="p">:</span>
+</span><span id="initialize_classifier-225"><a href="#initialize_classifier-225"><span class="linenos">225</span></a>        <span class="k">return</span> <span class="n">LogisticRegression</span><span class="p">(</span><span class="n">max_iter</span><span class="o">=</span><span class="mi">100000</span><span class="p">)</span>
+</span><span id="initialize_classifier-226"><a href="#initialize_classifier-226"><span class="linenos">226</span></a>    <span class="k">elif</span> <span class="s1">&#39;surrogate-SVM&#39;</span> <span class="ow">in</span> <span class="n">surrogate_model</span><span class="p">:</span>
+</span><span id="initialize_classifier-227"><a href="#initialize_classifier-227"><span class="linenos">227</span></a>        <span class="k">return</span> <span class="n">SVC</span><span class="p">(</span><span class="n">gamma</span><span class="o">=</span><span class="s1">&#39;auto&#39;</span><span class="p">,</span> <span class="n">probability</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="initialize_classifier-228"><a href="#initialize_classifier-228"><span class="linenos">228</span></a>    <span class="k">elif</span> <span class="s1">&#39;surrogate-SGD&#39;</span> <span class="ow">in</span> <span class="n">surrogate_model</span><span class="p">:</span>
+</span><span id="initialize_classifier-229"><a href="#initialize_classifier-229"><span class="linenos">229</span></a>        <span class="k">return</span> <span class="n">SGDClassifier</span><span class="p">(</span><span class="n">max_iter</span><span class="o">=</span><span class="mi">100000</span><span class="p">,</span> <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;log_loss&#39;</span><span class="p">)</span>
+</span><span id="initialize_classifier-230"><a href="#initialize_classifier-230"><span class="linenos">230</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="initialize_classifier-231"><a href="#initialize_classifier-231"><span class="linenos">231</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;The chosen surrogate model </span><span class="si">{</span><span class="n">surrogate_model</span><span class="si">}</span><span class="s1"> is not supported, falling back to surrogate-SGD&#39;</span><span class="p">)</span>
+</span><span id="initialize_classifier-232"><a href="#initialize_classifier-232"><span class="linenos">232</span></a>        <span class="k">return</span> <span class="n">SGDClassifier</span><span class="p">(</span><span class="n">max_iter</span><span class="o">=</span><span class="mi">100000</span><span class="p">,</span> <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;log_loss&#39;</span><span class="p">)</span>
+</span></pre></div>
+
 
+    
 
                 </section>
     </main>
@@ -781,4 +841,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/algorithms/sketches.html b/docs/outrank/algorithms/sketches.html
index a83e258..1c538f9 100644
--- a/docs/outrank/algorithms/sketches.html
+++ b/docs/outrank/algorithms/sketches.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.algorithms.sketches API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -48,10 +48,10 @@ <h2>Submodules</h2>
                     <h1 class="modulename">
 <a href="./../../outrank.html">outrank</a><wbr>.<a href="./../algorithms.html">algorithms</a><wbr>.sketches    </h1>
 
-
-
-
-
+                
+                
+                
+                
             </section>
     </main>
 <script>
@@ -236,4 +236,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/algorithms/sketches/counting_cms.html b/docs/outrank/algorithms/sketches/counting_cms.html
new file mode 100644
index 0000000..de254d1
--- /dev/null
+++ b/docs/outrank/algorithms/sketches/counting_cms.html
@@ -0,0 +1,554 @@
+<!doctype html>
+<html lang="en">
+<head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="pdoc 14.5.1"/>
+    <title>outrank.algorithms.sketches.counting_cms API documentation</title>
+
+    <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
+    <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
+    <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! custom.css */</style></head>
+<body>
+    <nav class="pdoc">
+        <label id="navtoggle" for="togglestate" class="pdoc-button"><svg xmlns='http://www.w3.org/2000/svg' viewBox='0 0 30 30'><path stroke-linecap='round' stroke="currentColor" stroke-miterlimit='10' stroke-width='2' d='M4 7h22M4 15h22M4 23h22'/></svg></label>
+        <input id="togglestate" type="checkbox" aria-hidden="true" tabindex="-1">
+        <div>            <a class="pdoc-button module-list-button" href="../sketches.html">
+<svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" fill="currentColor" class="bi bi-box-arrow-in-left" viewBox="0 0 16 16">
+  <path fill-rule="evenodd" d="M10 3.5a.5.5 0 0 0-.5-.5h-8a.5.5 0 0 0-.5.5v9a.5.5 0 0 0 .5.5h8a.5.5 0 0 0 .5-.5v-2a.5.5 0 0 1 1 0v2A1.5 1.5 0 0 1 9.5 14h-8A1.5 1.5 0 0 1 0 12.5v-9A1.5 1.5 0 0 1 1.5 2h8A1.5 1.5 0 0 1 11 3.5v2a.5.5 0 0 1-1 0v-2z"/>
+  <path fill-rule="evenodd" d="M4.146 8.354a.5.5 0 0 1 0-.708l3-3a.5.5 0 1 1 .708.708L5.707 7.5H14.5a.5.5 0 0 1 0 1H5.707l2.147 2.146a.5.5 0 0 1-.708.708l-3-3z"/>
+</svg>                &nbsp;outrank.algorithms.sketches</a>
+
+
+            <input type="search" placeholder="Search..." role="searchbox" aria-label="search"
+                   pattern=".+" required>
+
+
+
+            <h2>API Documentation</h2>
+                <ul class="memberlist">
+            <li>
+                    <a class="function" href="#cms_hash">cms_hash</a>
+            </li>
+            <li>
+                    <a class="class" href="#CountMinSketch">CountMinSketch</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#CountMinSketch.__init__">CountMinSketch</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#CountMinSketch.depth">depth</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#CountMinSketch.width">width</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#CountMinSketch.hash_seeds">hash_seeds</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#CountMinSketch.M">M</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#CountMinSketch.add">add</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#CountMinSketch.batch_add">batch_add</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#CountMinSketch.query">query</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#CountMinSketch.get_matrix">get_matrix</a>
+                        </li>
+                </ul>
+
+            </li>
+    </ul>
+
+
+
+        <a class="attribution" title="pdoc: Python API documentation generator" href="https://pdoc.dev" target="_blank">
+            built with <span class="visually-hidden">pdoc</span><img
+                alt="pdoc logo"
+                src="data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20role%3D%22img%22%20aria-label%3D%22pdoc%20logo%22%20width%3D%22300%22%20height%3D%22150%22%20viewBox%3D%22-1%200%2060%2030%22%3E%3Ctitle%3Epdoc%3C/title%3E%3Cpath%20d%3D%22M29.621%2021.293c-.011-.273-.214-.475-.511-.481a.5.5%200%200%200-.489.503l-.044%201.393c-.097.551-.695%201.215-1.566%201.704-.577.428-1.306.486-2.193.182-1.426-.617-2.467-1.654-3.304-2.487l-.173-.172a3.43%203.43%200%200%200-.365-.306.49.49%200%200%200-.286-.196c-1.718-1.06-4.931-1.47-7.353.191l-.219.15c-1.707%201.187-3.413%202.131-4.328%201.03-.02-.027-.49-.685-.141-1.763.233-.721.546-2.408.772-4.076.042-.09.067-.187.046-.288.166-1.347.277-2.625.241-3.351%201.378-1.008%202.271-2.586%202.271-4.362%200-.976-.272-1.935-.788-2.774-.057-.094-.122-.18-.184-.268.033-.167.052-.339.052-.516%200-1.477-1.202-2.679-2.679-2.679-.791%200-1.496.352-1.987.9a6.3%206.3%200%200%200-1.001.029c-.492-.564-1.207-.929-2.012-.929-1.477%200-2.679%201.202-2.679%202.679A2.65%202.65%200%200%200%20.97%206.554c-.383.747-.595%201.572-.595%202.41%200%202.311%201.507%204.29%203.635%205.107-.037.699-.147%202.27-.423%203.294l-.137.461c-.622%202.042-2.515%208.257%201.727%2010.643%201.614.908%203.06%201.248%204.317%201.248%202.665%200%204.492-1.524%205.322-2.401%201.476-1.559%202.886-1.854%206.491.82%201.877%201.393%203.514%201.753%204.861%201.068%202.223-1.713%202.811-3.867%203.399-6.374.077-.846.056-1.469.054-1.537zm-4.835%204.313c-.054.305-.156.586-.242.629-.034-.007-.131-.022-.307-.157-.145-.111-.314-.478-.456-.908.221.121.432.25.675.355.115.039.219.051.33.081zm-2.251-1.238c-.05.33-.158.648-.252.694-.022.001-.125-.018-.307-.157-.217-.166-.488-.906-.639-1.573.358.344.754.693%201.198%201.036zm-3.887-2.337c-.006-.116-.018-.231-.041-.342.635.145%201.189.368%201.599.625.097.231.166.481.174.642-.03.049-.055.101-.067.158-.046.013-.128.026-.298.004-.278-.037-.901-.57-1.367-1.087zm-1.127-.497c.116.306.176.625.12.71-.019.014-.117.045-.345.016-.206-.027-.604-.332-.986-.695.41-.051.816-.056%201.211-.031zm-4.535%201.535c.209.22.379.47.358.598-.006.041-.088.138-.351.234-.144.055-.539-.063-.979-.259a11.66%2011.66%200%200%200%20.972-.573zm.983-.664c.359-.237.738-.418%201.126-.554.25.237.479.548.457.694-.006.042-.087.138-.351.235-.174.064-.694-.105-1.232-.375zm-3.381%201.794c-.022.145-.061.29-.149.401-.133.166-.358.248-.69.251h-.002c-.133%200-.306-.26-.45-.621.417.091.854.07%201.291-.031zm-2.066-8.077a4.78%204.78%200%200%201-.775-.584c.172-.115.505-.254.88-.378l-.105.962zm-.331%202.302a10.32%2010.32%200%200%201-.828-.502c.202-.143.576-.328.984-.49l-.156.992zm-.45%202.157l-.701-.403c.214-.115.536-.249.891-.376a11.57%2011.57%200%200%201-.19.779zm-.181%201.716c.064.398.194.702.298.893-.194-.051-.435-.162-.736-.398.061-.119.224-.3.438-.495zM8.87%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zm-.735-.389a1.15%201.15%200%200%200-.314.783%201.16%201.16%200%200%200%201.162%201.162c.457%200%20.842-.27%201.032-.653.026.117.042.238.042.362a1.68%201.68%200%200%201-1.679%201.679%201.68%201.68%200%200%201-1.679-1.679c0-.843.626-1.535%201.436-1.654zM5.059%205.406A1.68%201.68%200%200%201%203.38%207.085a1.68%201.68%200%200%201-1.679-1.679c0-.037.009-.072.011-.109.21.3.541.508.935.508a1.16%201.16%200%200%200%201.162-1.162%201.14%201.14%200%200%200-.474-.912c.015%200%20.03-.005.045-.005.926.001%201.679.754%201.679%201.68zM3.198%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zM1.375%208.964c0-.52.103-1.035.288-1.52.466.394%201.06.64%201.717.64%201.144%200%202.116-.725%202.499-1.738.383%201.012%201.355%201.738%202.499%201.738.867%200%201.631-.421%202.121-1.062.307.605.478%201.267.478%201.942%200%202.486-2.153%204.51-4.801%204.51s-4.801-2.023-4.801-4.51zm24.342%2019.349c-.985.498-2.267.168-3.813-.979-3.073-2.281-5.453-3.199-7.813-.705-1.315%201.391-4.163%203.365-8.423.97-3.174-1.786-2.239-6.266-1.261-9.479l.146-.492c.276-1.02.395-2.457.444-3.268a6.11%206.11%200%200%200%201.18.115%206.01%206.01%200%200%200%202.536-.562l-.006.175c-.802.215-1.848.612-2.021%201.25-.079.295.021.601.274.837.219.203.415.364.598.501-.667.304-1.243.698-1.311%201.179-.02.144-.022.507.393.787.213.144.395.26.564.365-1.285.521-1.361.96-1.381%201.126-.018.142-.011.496.427.746l.854.489c-.473.389-.971.914-.999%201.429-.018.278.095.532.316.713.675.556%201.231.721%201.653.721.059%200%20.104-.014.158-.02.207.707.641%201.64%201.513%201.64h.013c.8-.008%201.236-.345%201.462-.626.173-.216.268-.457.325-.692.424.195.93.374%201.372.374.151%200%20.294-.021.423-.068.732-.27.944-.704.993-1.021.009-.061.003-.119.002-.179.266.086.538.147.789.147.15%200%20.294-.021.423-.069.542-.2.797-.489.914-.754.237.147.478.258.704.288.106.014.205.021.296.021.356%200%20.595-.101.767-.229.438.435%201.094.992%201.656%201.067.106.014.205.021.296.021a1.56%201.56%200%200%200%20.323-.035c.17.575.453%201.289.866%201.605.358.273.665.362.914.362a.99.99%200%200%200%20.421-.093%201.03%201.03%200%200%200%20.245-.164c.168.428.39.846.68%201.068.358.273.665.362.913.362a.99.99%200%200%200%20.421-.093c.317-.148.512-.448.639-.762.251.157.495.257.726.257.127%200%20.25-.024.37-.071.427-.17.706-.617.841-1.314.022-.015.047-.022.068-.038.067-.051.133-.104.196-.159-.443%201.486-1.107%202.761-2.086%203.257zM8.66%209.925a.5.5%200%201%200-1%200c0%20.653-.818%201.205-1.787%201.205s-1.787-.552-1.787-1.205a.5.5%200%201%200-1%200c0%201.216%201.25%202.205%202.787%202.205s2.787-.989%202.787-2.205zm4.4%2015.965l-.208.097c-2.661%201.258-4.708%201.436-6.086.527-1.542-1.017-1.88-3.19-1.844-4.198a.4.4%200%200%200-.385-.414c-.242-.029-.406.164-.414.385-.046%201.249.367%203.686%202.202%204.896.708.467%201.547.7%202.51.7%201.248%200%202.706-.392%204.362-1.174l.185-.086a.4.4%200%200%200%20.205-.527c-.089-.204-.326-.291-.527-.206zM9.547%202.292c.093.077.205.114.317.114a.5.5%200%200%200%20.318-.886L8.817.397a.5.5%200%200%200-.703.068.5.5%200%200%200%20.069.703l1.364%201.124zm-7.661-.065c.086%200%20.173-.022.253-.068l1.523-.893a.5.5%200%200%200-.506-.863l-1.523.892a.5.5%200%200%200-.179.685c.094.158.261.247.432.247z%22%20transform%3D%22matrix%28-1%200%200%201%2058%200%29%22%20fill%3D%22%233bb300%22/%3E%3Cpath%20d%3D%22M.3%2021.86V10.18q0-.46.02-.68.04-.22.18-.5.28-.54%201.34-.54%201.06%200%201.42.28.38.26.44.78.76-1.04%202.38-1.04%201.64%200%203.1%201.54%201.46%201.54%201.46%203.58%200%202.04-1.46%203.58-1.44%201.54-3.08%201.54-1.64%200-2.38-.92v4.04q0%20.46-.04.68-.02.22-.18.5-.14.3-.5.42-.36.12-.98.12-.62%200-1-.12-.36-.12-.52-.4-.14-.28-.18-.5-.02-.22-.02-.68zm3.96-9.42q-.46.54-.46%201.18%200%20.64.46%201.18.48.52%201.2.52.74%200%201.24-.52.52-.52.52-1.18%200-.66-.48-1.18-.48-.54-1.26-.54-.76%200-1.22.54zm14.741-8.36q.16-.3.54-.42.38-.12%201-.12.64%200%201.02.12.38.12.52.42.16.3.18.54.04.22.04.68v11.94q0%20.46-.04.7-.02.22-.18.5-.3.54-1.7.54-1.38%200-1.54-.98-.84.96-2.34.96-1.8%200-3.28-1.56-1.48-1.58-1.48-3.66%200-2.1%201.48-3.68%201.5-1.58%203.28-1.58%201.48%200%202.3%201v-4.2q0-.46.02-.68.04-.24.18-.52zm-3.24%2010.86q.52.54%201.26.54.74%200%201.22-.54.5-.54.5-1.18%200-.66-.48-1.22-.46-.56-1.26-.56-.8%200-1.28.56-.48.54-.48%201.2%200%20.66.52%201.2zm7.833-1.2q0-2.4%201.68-3.96%201.68-1.56%203.84-1.56%202.16%200%203.82%201.56%201.66%201.54%201.66%203.94%200%201.66-.86%202.96-.86%201.28-2.1%201.9-1.22.6-2.54.6-1.32%200-2.56-.64-1.24-.66-2.1-1.92-.84-1.28-.84-2.88zm4.18%201.44q.64.48%201.3.48.66%200%201.32-.5.66-.5.66-1.48%200-.98-.62-1.46-.62-.48-1.34-.48-.72%200-1.34.5-.62.5-.62%201.48%200%20.96.64%201.46zm11.412-1.44q0%20.84.56%201.32.56.46%201.18.46.64%200%201.18-.36.56-.38.9-.38.6%200%201.46%201.06.46.58.46%201.04%200%20.76-1.1%201.42-1.14.8-2.8.8-1.86%200-3.58-1.34-.82-.64-1.34-1.7-.52-1.08-.52-2.36%200-1.3.52-2.34.52-1.06%201.34-1.7%201.66-1.32%203.54-1.32.76%200%201.48.22.72.2%201.06.4l.32.2q.36.24.56.38.52.4.52.92%200%20.5-.42%201.14-.72%201.1-1.38%201.1-.38%200-1.08-.44-.36-.34-1.04-.34-.66%200-1.24.48-.58.48-.58%201.34z%22%20fill%3D%22green%22/%3E%3C/svg%3E"/>
+        </a>
+</div>
+    </nav>
+    <main class="pdoc">
+            <section class="module-info">
+                    <h1 class="modulename">
+<a href="./../../../outrank.html">outrank</a><wbr>.<a href="./../../algorithms.html">algorithms</a><wbr>.<a href="./../sketches.html">sketches</a><wbr>.counting_cms    </h1>
+
+                
+                        <input id="mod-counting_cms-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+
+                        <label class="view-source-button" for="mod-counting_cms-view-source"><span>View Source</span></label>
+
+                        <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos"> 1</span></a><span class="kn">from</span> <span class="nn">__future__</span> <span class="kn">import</span> <span class="n">annotations</span>
+</span><span id="L-2"><a href="#L-2"><span class="linenos"> 2</span></a>
+</span><span id="L-3"><a href="#L-3"><span class="linenos"> 3</span></a><span class="kn">import</span> <span class="nn">sys</span>
+</span><span id="L-4"><a href="#L-4"><span class="linenos"> 4</span></a><span class="kn">from</span> <span class="nn">collections</span> <span class="kn">import</span> <span class="n">Counter</span>
+</span><span id="L-5"><a href="#L-5"><span class="linenos"> 5</span></a>
+</span><span id="L-6"><a href="#L-6"><span class="linenos"> 6</span></a><span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos"> 7</span></a><span class="kn">from</span> <span class="nn">numba</span> <span class="kn">import</span> <span class="n">njit</span>
+</span><span id="L-8"><a href="#L-8"><span class="linenos"> 8</span></a><span class="kn">from</span> <span class="nn">numba</span> <span class="kn">import</span> <span class="n">prange</span>
+</span><span id="L-9"><a href="#L-9"><span class="linenos"> 9</span></a>
+</span><span id="L-10"><a href="#L-10"><span class="linenos">10</span></a>
+</span><span id="L-11"><a href="#L-11"><span class="linenos">11</span></a><span class="nd">@njit</span>
+</span><span id="L-12"><a href="#L-12"><span class="linenos">12</span></a><span class="k">def</span> <span class="nf">cms_hash</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">seed</span><span class="p">,</span> <span class="n">width</span><span class="p">):</span>
+</span><span id="L-13"><a href="#L-13"><span class="linenos">13</span></a>    <span class="n">x_hash</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">(</span><span class="nb">hash</span><span class="p">(</span><span class="n">x</span><span class="p">))</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos">14</span></a>    <span class="k">return</span> <span class="p">(</span><span class="n">x_hash</span> <span class="o">+</span> <span class="n">seed</span><span class="p">)</span> <span class="o">%</span> <span class="n">width</span>
+</span><span id="L-15"><a href="#L-15"><span class="linenos">15</span></a>
+</span><span id="L-16"><a href="#L-16"><span class="linenos">16</span></a><span class="k">class</span> <span class="nc">CountMinSketch</span><span class="p">:</span>
+</span><span id="L-17"><a href="#L-17"><span class="linenos">17</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos">18</span></a><span class="sd">    A memory-efficient implementation of the count min sketch algorithm with optimized hashing using Numba JIT.</span>
+</span><span id="L-19"><a href="#L-19"><span class="linenos">19</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos">20</span></a>
+</span><span id="L-21"><a href="#L-21"><span class="linenos">21</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">depth</span><span class="o">=</span><span class="mi">6</span><span class="p">,</span> <span class="n">width</span><span class="o">=</span><span class="mi">2</span><span class="o">**</span><span class="mi">15</span><span class="p">,</span> <span class="n">M</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos">22</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="o">=</span> <span class="n">depth</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos">23</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">width</span> <span class="o">=</span> <span class="n">width</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">hash_seeds</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="n">low</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">high</span><span class="o">=</span><span class="mi">2</span><span class="o">**</span><span class="mi">31</span> <span class="o">-</span> <span class="mi">1</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="n">depth</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">M</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">((</span><span class="n">depth</span><span class="p">,</span> <span class="n">width</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">int32</span><span class="p">)</span> <span class="k">if</span> <span class="n">M</span> <span class="ow">is</span> <span class="kc">None</span> <span class="k">else</span> <span class="n">M</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a>
+</span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a>    <span class="nd">@staticmethod</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos">28</span></a>    <span class="nd">@njit</span>
+</span><span id="L-29"><a href="#L-29"><span class="linenos">29</span></a>    <span class="k">def</span> <span class="nf">_add</span><span class="p">(</span><span class="n">M</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">hash_seeds</span><span class="p">,</span> <span class="n">delta</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos">30</span></a>        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">prange</span><span class="p">(</span><span class="n">depth</span><span class="p">):</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos">31</span></a>            <span class="n">location</span> <span class="o">=</span> <span class="n">cms_hash</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">hash_seeds</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">width</span><span class="p">)</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos">32</span></a>            <span class="n">M</span><span class="p">[</span><span class="n">i</span><span class="p">,</span> <span class="n">location</span><span class="p">]</span> <span class="o">+=</span> <span class="n">delta</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos">33</span></a>
+</span><span id="L-34"><a href="#L-34"><span class="linenos">34</span></a>    <span class="k">def</span> <span class="nf">add</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">delta</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos">35</span></a>        <span class="n">CountMinSketch</span><span class="o">.</span><span class="n">_add</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">M</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">depth</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">hash_seeds</span><span class="p">,</span> <span class="n">delta</span><span class="p">)</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos">36</span></a>
+</span><span id="L-37"><a href="#L-37"><span class="linenos">37</span></a>    <span class="k">def</span> <span class="nf">batch_add</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">lst</span><span class="p">,</span> <span class="n">delta</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos">38</span></a>        <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">lst</span><span class="p">:</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos">39</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">delta</span><span class="p">)</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos">40</span></a>
+</span><span id="L-41"><a href="#L-41"><span class="linenos">41</span></a>    <span class="k">def</span> <span class="nf">query</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">):</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos">42</span></a>        <span class="k">return</span> <span class="nb">min</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">M</span><span class="p">[</span><span class="n">i</span><span class="p">][</span><span class="n">cms_hash</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">hash_seeds</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">width</span><span class="p">)]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">depth</span><span class="p">))</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos">43</span></a>
+</span><span id="L-44"><a href="#L-44"><span class="linenos">44</span></a>    <span class="k">def</span> <span class="nf">get_matrix</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos">45</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">M</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos">46</span></a>
+</span><span id="L-47"><a href="#L-47"><span class="linenos">47</span></a>
+</span><span id="L-48"><a href="#L-48"><span class="linenos">48</span></a><span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s1">&#39;__main__&#39;</span><span class="p">:</span>
+</span><span id="L-49"><a href="#L-49"><span class="linenos">49</span></a>    <span class="kn">from</span> <span class="nn">collections</span> <span class="kn">import</span> <span class="n">Counter</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos">50</span></a>
+</span><span id="L-51"><a href="#L-51"><span class="linenos">51</span></a>    <span class="n">depth</span> <span class="o">=</span> <span class="mi">8</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos">52</span></a>    <span class="n">width</span> <span class="o">=</span> <span class="mi">2</span><span class="o">**</span><span class="mi">22</span>
+</span><span id="L-53"><a href="#L-53"><span class="linenos">53</span></a>    <span class="n">cms</span> <span class="o">=</span> <span class="n">CountMinSketch</span><span class="p">(</span><span class="n">depth</span><span class="p">,</span> <span class="n">width</span><span class="p">)</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos">54</span></a>
+</span><span id="L-55"><a href="#L-55"><span class="linenos">55</span></a>    <span class="n">items</span> <span class="o">=</span> <span class="p">[</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">5</span><span class="p">,</span> <span class="mi">2</span><span class="p">]</span> <span class="o">*</span> <span class="mi">1000</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos">56</span></a>    <span class="n">cms</span><span class="o">.</span><span class="n">batch_add</span><span class="p">(</span><span class="n">items</span><span class="p">)</span>  <span class="c1"># Use the batch_add function</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos">57</span></a>
+</span><span id="L-58"><a href="#L-58"><span class="linenos">58</span></a>    <span class="nb">print</span><span class="p">(</span><span class="n">cms</span><span class="o">.</span><span class="n">query</span><span class="p">(</span><span class="mi">3</span><span class="p">))</span>  <span class="c1"># Query for frequency estimates</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos">59</span></a>    <span class="nb">print</span><span class="p">(</span><span class="n">cms</span><span class="o">.</span><span class="n">query</span><span class="p">(</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos">60</span></a>    <span class="nb">print</span><span class="p">(</span><span class="n">cms</span><span class="o">.</span><span class="n">query</span><span class="p">(</span><span class="mi">2</span><span class="p">))</span>
+</span><span id="L-61"><a href="#L-61"><span class="linenos">61</span></a>    <span class="nb">print</span><span class="p">(</span><span class="n">cms</span><span class="o">.</span><span class="n">query</span><span class="p">(</span><span class="mi">4</span><span class="p">))</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos">62</span></a>    <span class="nb">print</span><span class="p">(</span><span class="n">cms</span><span class="o">.</span><span class="n">query</span><span class="p">(</span><span class="mi">5</span><span class="p">))</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos">63</span></a>
+</span><span id="L-64"><a href="#L-64"><span class="linenos">64</span></a>    <span class="nb">print</span><span class="p">(</span><span class="n">Counter</span><span class="p">(</span><span class="n">items</span><span class="p">))</span>  <span class="c1"># Print the exact counts for comparison</span>
+</span></pre></div>
+
+
+            </section>
+                <section id="cms_hash">
+                            <input id="cms_hash-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+                    <div class="decorator">@njit</div>
+
+        <span class="def">def</span>
+        <span class="name">cms_hash</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">x</span>, </span><span class="param"><span class="n">seed</span>, </span><span class="param"><span class="n">width</span></span><span class="return-annotation">):</span></span>
+
+                <label class="view-source-button" for="cms_hash-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#cms_hash"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="cms_hash-12"><a href="#cms_hash-12"><span class="linenos">12</span></a><span class="nd">@njit</span>
+</span><span id="cms_hash-13"><a href="#cms_hash-13"><span class="linenos">13</span></a><span class="k">def</span> <span class="nf">cms_hash</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">seed</span><span class="p">,</span> <span class="n">width</span><span class="p">):</span>
+</span><span id="cms_hash-14"><a href="#cms_hash-14"><span class="linenos">14</span></a>    <span class="n">x_hash</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">(</span><span class="nb">hash</span><span class="p">(</span><span class="n">x</span><span class="p">))</span>
+</span><span id="cms_hash-15"><a href="#cms_hash-15"><span class="linenos">15</span></a>    <span class="k">return</span> <span class="p">(</span><span class="n">x_hash</span> <span class="o">+</span> <span class="n">seed</span><span class="p">)</span> <span class="o">%</span> <span class="n">width</span>
+</span></pre></div>
+
+
+    
+
+                </section>
+                <section id="CountMinSketch">
+                            <input id="CountMinSketch-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">CountMinSketch</span>:
+
+                <label class="view-source-button" for="CountMinSketch-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#CountMinSketch"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CountMinSketch-17"><a href="#CountMinSketch-17"><span class="linenos">17</span></a><span class="k">class</span> <span class="nc">CountMinSketch</span><span class="p">:</span>
+</span><span id="CountMinSketch-18"><a href="#CountMinSketch-18"><span class="linenos">18</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CountMinSketch-19"><a href="#CountMinSketch-19"><span class="linenos">19</span></a><span class="sd">    A memory-efficient implementation of the count min sketch algorithm with optimized hashing using Numba JIT.</span>
+</span><span id="CountMinSketch-20"><a href="#CountMinSketch-20"><span class="linenos">20</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="CountMinSketch-21"><a href="#CountMinSketch-21"><span class="linenos">21</span></a>
+</span><span id="CountMinSketch-22"><a href="#CountMinSketch-22"><span class="linenos">22</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">depth</span><span class="o">=</span><span class="mi">6</span><span class="p">,</span> <span class="n">width</span><span class="o">=</span><span class="mi">2</span><span class="o">**</span><span class="mi">15</span><span class="p">,</span> <span class="n">M</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+</span><span id="CountMinSketch-23"><a href="#CountMinSketch-23"><span class="linenos">23</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="o">=</span> <span class="n">depth</span>
+</span><span id="CountMinSketch-24"><a href="#CountMinSketch-24"><span class="linenos">24</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">width</span> <span class="o">=</span> <span class="n">width</span>
+</span><span id="CountMinSketch-25"><a href="#CountMinSketch-25"><span class="linenos">25</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">hash_seeds</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="n">low</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">high</span><span class="o">=</span><span class="mi">2</span><span class="o">**</span><span class="mi">31</span> <span class="o">-</span> <span class="mi">1</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="n">depth</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="CountMinSketch-26"><a href="#CountMinSketch-26"><span class="linenos">26</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">M</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">((</span><span class="n">depth</span><span class="p">,</span> <span class="n">width</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">int32</span><span class="p">)</span> <span class="k">if</span> <span class="n">M</span> <span class="ow">is</span> <span class="kc">None</span> <span class="k">else</span> <span class="n">M</span>
+</span><span id="CountMinSketch-27"><a href="#CountMinSketch-27"><span class="linenos">27</span></a>
+</span><span id="CountMinSketch-28"><a href="#CountMinSketch-28"><span class="linenos">28</span></a>    <span class="nd">@staticmethod</span>
+</span><span id="CountMinSketch-29"><a href="#CountMinSketch-29"><span class="linenos">29</span></a>    <span class="nd">@njit</span>
+</span><span id="CountMinSketch-30"><a href="#CountMinSketch-30"><span class="linenos">30</span></a>    <span class="k">def</span> <span class="nf">_add</span><span class="p">(</span><span class="n">M</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">hash_seeds</span><span class="p">,</span> <span class="n">delta</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
+</span><span id="CountMinSketch-31"><a href="#CountMinSketch-31"><span class="linenos">31</span></a>        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">prange</span><span class="p">(</span><span class="n">depth</span><span class="p">):</span>
+</span><span id="CountMinSketch-32"><a href="#CountMinSketch-32"><span class="linenos">32</span></a>            <span class="n">location</span> <span class="o">=</span> <span class="n">cms_hash</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">hash_seeds</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">width</span><span class="p">)</span>
+</span><span id="CountMinSketch-33"><a href="#CountMinSketch-33"><span class="linenos">33</span></a>            <span class="n">M</span><span class="p">[</span><span class="n">i</span><span class="p">,</span> <span class="n">location</span><span class="p">]</span> <span class="o">+=</span> <span class="n">delta</span>
+</span><span id="CountMinSketch-34"><a href="#CountMinSketch-34"><span class="linenos">34</span></a>
+</span><span id="CountMinSketch-35"><a href="#CountMinSketch-35"><span class="linenos">35</span></a>    <span class="k">def</span> <span class="nf">add</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">delta</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
+</span><span id="CountMinSketch-36"><a href="#CountMinSketch-36"><span class="linenos">36</span></a>        <span class="n">CountMinSketch</span><span class="o">.</span><span class="n">_add</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">M</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">depth</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">hash_seeds</span><span class="p">,</span> <span class="n">delta</span><span class="p">)</span>
+</span><span id="CountMinSketch-37"><a href="#CountMinSketch-37"><span class="linenos">37</span></a>
+</span><span id="CountMinSketch-38"><a href="#CountMinSketch-38"><span class="linenos">38</span></a>    <span class="k">def</span> <span class="nf">batch_add</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">lst</span><span class="p">,</span> <span class="n">delta</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
+</span><span id="CountMinSketch-39"><a href="#CountMinSketch-39"><span class="linenos">39</span></a>        <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">lst</span><span class="p">:</span>
+</span><span id="CountMinSketch-40"><a href="#CountMinSketch-40"><span class="linenos">40</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">delta</span><span class="p">)</span>
+</span><span id="CountMinSketch-41"><a href="#CountMinSketch-41"><span class="linenos">41</span></a>
+</span><span id="CountMinSketch-42"><a href="#CountMinSketch-42"><span class="linenos">42</span></a>    <span class="k">def</span> <span class="nf">query</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">):</span>
+</span><span id="CountMinSketch-43"><a href="#CountMinSketch-43"><span class="linenos">43</span></a>        <span class="k">return</span> <span class="nb">min</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">M</span><span class="p">[</span><span class="n">i</span><span class="p">][</span><span class="n">cms_hash</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">hash_seeds</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">width</span><span class="p">)]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">depth</span><span class="p">))</span>
+</span><span id="CountMinSketch-44"><a href="#CountMinSketch-44"><span class="linenos">44</span></a>
+</span><span id="CountMinSketch-45"><a href="#CountMinSketch-45"><span class="linenos">45</span></a>    <span class="k">def</span> <span class="nf">get_matrix</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="CountMinSketch-46"><a href="#CountMinSketch-46"><span class="linenos">46</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">M</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>A memory-efficient implementation of the count min sketch algorithm with optimized hashing using Numba JIT.</p>
+</div>
+
+
+                            <div id="CountMinSketch.__init__" class="classattr">
+                                        <input id="CountMinSketch.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">CountMinSketch</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">depth</span><span class="o">=</span><span class="mi">6</span>, </span><span class="param"><span class="n">width</span><span class="o">=</span><span class="mi">32768</span>, </span><span class="param"><span class="n">M</span><span class="o">=</span><span class="kc">None</span></span>)</span>
+
+                <label class="view-source-button" for="CountMinSketch.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#CountMinSketch.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CountMinSketch.__init__-22"><a href="#CountMinSketch.__init__-22"><span class="linenos">22</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">depth</span><span class="o">=</span><span class="mi">6</span><span class="p">,</span> <span class="n">width</span><span class="o">=</span><span class="mi">2</span><span class="o">**</span><span class="mi">15</span><span class="p">,</span> <span class="n">M</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+</span><span id="CountMinSketch.__init__-23"><a href="#CountMinSketch.__init__-23"><span class="linenos">23</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="o">=</span> <span class="n">depth</span>
+</span><span id="CountMinSketch.__init__-24"><a href="#CountMinSketch.__init__-24"><span class="linenos">24</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">width</span> <span class="o">=</span> <span class="n">width</span>
+</span><span id="CountMinSketch.__init__-25"><a href="#CountMinSketch.__init__-25"><span class="linenos">25</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">hash_seeds</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="n">low</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">high</span><span class="o">=</span><span class="mi">2</span><span class="o">**</span><span class="mi">31</span> <span class="o">-</span> <span class="mi">1</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="n">depth</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="CountMinSketch.__init__-26"><a href="#CountMinSketch.__init__-26"><span class="linenos">26</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">M</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">((</span><span class="n">depth</span><span class="p">,</span> <span class="n">width</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">int32</span><span class="p">)</span> <span class="k">if</span> <span class="n">M</span> <span class="ow">is</span> <span class="kc">None</span> <span class="k">else</span> <span class="n">M</span>
+</span></pre></div>
+
+
+    
+
+                            </div>
+                            <div id="CountMinSketch.depth" class="classattr">
+                                <div class="attr variable">
+            <span class="name">depth</span>
+
+        
+    </div>
+    <a class="headerlink" href="#CountMinSketch.depth"></a>
+    
+    
+
+                            </div>
+                            <div id="CountMinSketch.width" class="classattr">
+                                <div class="attr variable">
+            <span class="name">width</span>
+
+        
+    </div>
+    <a class="headerlink" href="#CountMinSketch.width"></a>
+    
+    
+
+                            </div>
+                            <div id="CountMinSketch.hash_seeds" class="classattr">
+                                <div class="attr variable">
+            <span class="name">hash_seeds</span>
+
+        
+    </div>
+    <a class="headerlink" href="#CountMinSketch.hash_seeds"></a>
+    
+    
+
+                            </div>
+                            <div id="CountMinSketch.M" class="classattr">
+                                <div class="attr variable">
+            <span class="name">M</span>
+
+        
+    </div>
+    <a class="headerlink" href="#CountMinSketch.M"></a>
+    
+    
+
+                            </div>
+                            <div id="CountMinSketch.add" class="classattr">
+                                        <input id="CountMinSketch.add-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">add</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">x</span>, </span><span class="param"><span class="n">delta</span><span class="o">=</span><span class="mi">1</span></span><span class="return-annotation">):</span></span>
+
+                <label class="view-source-button" for="CountMinSketch.add-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#CountMinSketch.add"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CountMinSketch.add-35"><a href="#CountMinSketch.add-35"><span class="linenos">35</span></a>    <span class="k">def</span> <span class="nf">add</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">delta</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
+</span><span id="CountMinSketch.add-36"><a href="#CountMinSketch.add-36"><span class="linenos">36</span></a>        <span class="n">CountMinSketch</span><span class="o">.</span><span class="n">_add</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">M</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">depth</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">hash_seeds</span><span class="p">,</span> <span class="n">delta</span><span class="p">)</span>
+</span></pre></div>
+
+
+    
+
+                            </div>
+                            <div id="CountMinSketch.batch_add" class="classattr">
+                                        <input id="CountMinSketch.batch_add-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">batch_add</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">lst</span>, </span><span class="param"><span class="n">delta</span><span class="o">=</span><span class="mi">1</span></span><span class="return-annotation">):</span></span>
+
+                <label class="view-source-button" for="CountMinSketch.batch_add-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#CountMinSketch.batch_add"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CountMinSketch.batch_add-38"><a href="#CountMinSketch.batch_add-38"><span class="linenos">38</span></a>    <span class="k">def</span> <span class="nf">batch_add</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">lst</span><span class="p">,</span> <span class="n">delta</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
+</span><span id="CountMinSketch.batch_add-39"><a href="#CountMinSketch.batch_add-39"><span class="linenos">39</span></a>        <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">lst</span><span class="p">:</span>
+</span><span id="CountMinSketch.batch_add-40"><a href="#CountMinSketch.batch_add-40"><span class="linenos">40</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">delta</span><span class="p">)</span>
+</span></pre></div>
+
+
+    
+
+                            </div>
+                            <div id="CountMinSketch.query" class="classattr">
+                                        <input id="CountMinSketch.query-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">query</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">x</span></span><span class="return-annotation">):</span></span>
+
+                <label class="view-source-button" for="CountMinSketch.query-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#CountMinSketch.query"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CountMinSketch.query-42"><a href="#CountMinSketch.query-42"><span class="linenos">42</span></a>    <span class="k">def</span> <span class="nf">query</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">):</span>
+</span><span id="CountMinSketch.query-43"><a href="#CountMinSketch.query-43"><span class="linenos">43</span></a>        <span class="k">return</span> <span class="nb">min</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">M</span><span class="p">[</span><span class="n">i</span><span class="p">][</span><span class="n">cms_hash</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">hash_seeds</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">width</span><span class="p">)]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">depth</span><span class="p">))</span>
+</span></pre></div>
+
+
+    
+
+                            </div>
+                            <div id="CountMinSketch.get_matrix" class="classattr">
+                                        <input id="CountMinSketch.get_matrix-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">get_matrix</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span></span><span class="return-annotation">):</span></span>
+
+                <label class="view-source-button" for="CountMinSketch.get_matrix-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#CountMinSketch.get_matrix"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CountMinSketch.get_matrix-45"><a href="#CountMinSketch.get_matrix-45"><span class="linenos">45</span></a>    <span class="k">def</span> <span class="nf">get_matrix</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="CountMinSketch.get_matrix-46"><a href="#CountMinSketch.get_matrix-46"><span class="linenos">46</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">M</span>
+</span></pre></div>
+
+
+    
+
+                            </div>
+                </section>
+    </main>
+<script>
+    function escapeHTML(html) {
+        return document.createElement('div').appendChild(document.createTextNode(html)).parentNode.innerHTML;
+    }
+
+    const originalContent = document.querySelector("main.pdoc");
+    let currentContent = originalContent;
+
+    function setContent(innerHTML) {
+        let elem;
+        if (innerHTML) {
+            elem = document.createElement("main");
+            elem.classList.add("pdoc");
+            elem.innerHTML = innerHTML;
+        } else {
+            elem = originalContent;
+        }
+        if (currentContent !== elem) {
+            currentContent.replaceWith(elem);
+            currentContent = elem;
+        }
+    }
+
+    function getSearchTerm() {
+        return (new URL(window.location)).searchParams.get("search");
+    }
+
+    const searchBox = document.querySelector(".pdoc input[type=search]");
+    searchBox.addEventListener("input", function () {
+        let url = new URL(window.location);
+        if (searchBox.value.trim()) {
+            url.hash = "";
+            url.searchParams.set("search", searchBox.value);
+        } else {
+            url.searchParams.delete("search");
+        }
+        history.replaceState("", "", url.toString());
+        onInput();
+    });
+    window.addEventListener("popstate", onInput);
+
+
+    let search, searchErr;
+
+    async function initialize() {
+        try {
+            search = await new Promise((resolve, reject) => {
+                const script = document.createElement("script");
+                script.type = "text/javascript";
+                script.async = true;
+                script.onload = () => resolve(window.pdocSearch);
+                script.onerror = (e) => reject(e);
+                script.src = "../../../search.js";
+                document.getElementsByTagName("head")[0].appendChild(script);
+            });
+        } catch (e) {
+            console.error("Cannot fetch pdoc search index");
+            searchErr = "Cannot fetch search index.";
+        }
+        onInput();
+
+        document.querySelector("nav.pdoc").addEventListener("click", e => {
+            if (e.target.hash) {
+                searchBox.value = "";
+                searchBox.dispatchEvent(new Event("input"));
+            }
+        });
+    }
+
+    function onInput() {
+        setContent((() => {
+            const term = getSearchTerm();
+            if (!term) {
+                return null
+            }
+            if (searchErr) {
+                return `<h3>Error: ${searchErr}</h3>`
+            }
+            if (!search) {
+                return "<h3>Searching...</h3>"
+            }
+
+            window.scrollTo({top: 0, left: 0, behavior: 'auto'});
+
+            const results = search(term);
+
+            let html;
+            if (results.length === 0) {
+                html = `No search results for '${escapeHTML(term)}'.`
+            } else {
+                html = `<h4>${results.length} search result${results.length > 1 ? "s" : ""} for '${escapeHTML(term)}'.</h4>`;
+            }
+            for (let result of results.slice(0, 10)) {
+                let doc = result.doc;
+                let url = `../../../${doc.modulename.replaceAll(".", "/")}.html`;
+                if (doc.qualname) {
+                    url += `#${doc.qualname}`;
+                }
+
+                let heading;
+                switch (result.doc.kind) {
+                    case "function":
+                        if (doc.fullname.endsWith(".__init__")) {
+                            heading = `<span class="name">${doc.fullname.replace(/\.__init__$/, "")}</span>${doc.signature}`;
+                        } else {
+                            heading = `<span class="def">${doc.funcdef}</span> <span class="name">${doc.fullname}</span>${doc.signature}`;
+                        }
+                        break;
+                    case "class":
+                        heading = `<span class="def">class</span> <span class="name">${doc.fullname}</span>`;
+                        if (doc.bases)
+                            heading += `<wbr>(<span class="base">${doc.bases}</span>)`;
+                        heading += `:`;
+                        break;
+                    case "variable":
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        if (doc.annotation)
+                            heading += `<span class="annotation">${doc.annotation}</span>`;
+                        if (doc.default_value)
+                            heading += `<span class="default_value"> = ${doc.default_value}</span>`;
+                        break;
+                    default:
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        break;
+                }
+                html += `
+                        <section class="search-result">
+                        <a href="${url}" class="attr ${doc.kind}">${heading}</a>
+                        <div class="docstring">${doc.doc}</div>
+                        </section>
+                    `;
+
+            }
+            return html;
+        })());
+    }
+
+    if (getSearchTerm()) {
+        initialize();
+        searchBox.value = getSearchTerm();
+        onInput();
+    } else {
+        searchBox.addEventListener("focus", initialize, {once: true});
+    }
+
+    searchBox.addEventListener("keydown", e => {
+        if (["ArrowDown", "ArrowUp", "Enter"].includes(e.key)) {
+            let focused = currentContent.querySelector(".search-result.focused");
+            if (!focused) {
+                currentContent.querySelector(".search-result").classList.add("focused");
+            } else if (
+                e.key === "ArrowDown"
+                && focused.nextElementSibling
+                && focused.nextElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.nextElementSibling.classList.add("focused");
+                focused.nextElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "ArrowUp"
+                && focused.previousElementSibling
+                && focused.previousElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.previousElementSibling.classList.add("focused");
+                focused.previousElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "Enter"
+            ) {
+                focused.querySelector("a").click();
+            }
+        }
+    });
+</script></body>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/algorithms/sketches/counting_counters_ordinary.html b/docs/outrank/algorithms/sketches/counting_counters_ordinary.html
new file mode 100644
index 0000000..59d9477
--- /dev/null
+++ b/docs/outrank/algorithms/sketches/counting_counters_ordinary.html
@@ -0,0 +1,413 @@
+<!doctype html>
+<html lang="en">
+<head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="pdoc 14.5.1"/>
+    <title>outrank.algorithms.sketches.counting_counters_ordinary API documentation</title>
+
+    <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
+    <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
+    <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! custom.css */</style></head>
+<body>
+    <nav class="pdoc">
+        <label id="navtoggle" for="togglestate" class="pdoc-button"><svg xmlns='http://www.w3.org/2000/svg' viewBox='0 0 30 30'><path stroke-linecap='round' stroke="currentColor" stroke-miterlimit='10' stroke-width='2' d='M4 7h22M4 15h22M4 23h22'/></svg></label>
+        <input id="togglestate" type="checkbox" aria-hidden="true" tabindex="-1">
+        <div>            <a class="pdoc-button module-list-button" href="../sketches.html">
+<svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" fill="currentColor" class="bi bi-box-arrow-in-left" viewBox="0 0 16 16">
+  <path fill-rule="evenodd" d="M10 3.5a.5.5 0 0 0-.5-.5h-8a.5.5 0 0 0-.5.5v9a.5.5 0 0 0 .5.5h8a.5.5 0 0 0 .5-.5v-2a.5.5 0 0 1 1 0v2A1.5 1.5 0 0 1 9.5 14h-8A1.5 1.5 0 0 1 0 12.5v-9A1.5 1.5 0 0 1 1.5 2h8A1.5 1.5 0 0 1 11 3.5v2a.5.5 0 0 1-1 0v-2z"/>
+  <path fill-rule="evenodd" d="M4.146 8.354a.5.5 0 0 1 0-.708l3-3a.5.5 0 1 1 .708.708L5.707 7.5H14.5a.5.5 0 0 1 0 1H5.707l2.147 2.146a.5.5 0 0 1-.708.708l-3-3z"/>
+</svg>                &nbsp;outrank.algorithms.sketches</a>
+
+
+            <input type="search" placeholder="Search..." role="searchbox" aria-label="search"
+                   pattern=".+" required>
+
+
+
+            <h2>API Documentation</h2>
+                <ul class="memberlist">
+            <li>
+                    <a class="class" href="#PrimitiveConstrainedCounter">PrimitiveConstrainedCounter</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#PrimitiveConstrainedCounter.__init__">PrimitiveConstrainedCounter</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#PrimitiveConstrainedCounter.max_bound_thr">max_bound_thr</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#PrimitiveConstrainedCounter.default_counter">default_counter</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#PrimitiveConstrainedCounter.batch_add">batch_add</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#PrimitiveConstrainedCounter.add">add</a>
+                        </li>
+                </ul>
+
+            </li>
+    </ul>
+
+
+
+        <a class="attribution" title="pdoc: Python API documentation generator" href="https://pdoc.dev" target="_blank">
+            built with <span class="visually-hidden">pdoc</span><img
+                alt="pdoc logo"
+                src="data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20role%3D%22img%22%20aria-label%3D%22pdoc%20logo%22%20width%3D%22300%22%20height%3D%22150%22%20viewBox%3D%22-1%200%2060%2030%22%3E%3Ctitle%3Epdoc%3C/title%3E%3Cpath%20d%3D%22M29.621%2021.293c-.011-.273-.214-.475-.511-.481a.5.5%200%200%200-.489.503l-.044%201.393c-.097.551-.695%201.215-1.566%201.704-.577.428-1.306.486-2.193.182-1.426-.617-2.467-1.654-3.304-2.487l-.173-.172a3.43%203.43%200%200%200-.365-.306.49.49%200%200%200-.286-.196c-1.718-1.06-4.931-1.47-7.353.191l-.219.15c-1.707%201.187-3.413%202.131-4.328%201.03-.02-.027-.49-.685-.141-1.763.233-.721.546-2.408.772-4.076.042-.09.067-.187.046-.288.166-1.347.277-2.625.241-3.351%201.378-1.008%202.271-2.586%202.271-4.362%200-.976-.272-1.935-.788-2.774-.057-.094-.122-.18-.184-.268.033-.167.052-.339.052-.516%200-1.477-1.202-2.679-2.679-2.679-.791%200-1.496.352-1.987.9a6.3%206.3%200%200%200-1.001.029c-.492-.564-1.207-.929-2.012-.929-1.477%200-2.679%201.202-2.679%202.679A2.65%202.65%200%200%200%20.97%206.554c-.383.747-.595%201.572-.595%202.41%200%202.311%201.507%204.29%203.635%205.107-.037.699-.147%202.27-.423%203.294l-.137.461c-.622%202.042-2.515%208.257%201.727%2010.643%201.614.908%203.06%201.248%204.317%201.248%202.665%200%204.492-1.524%205.322-2.401%201.476-1.559%202.886-1.854%206.491.82%201.877%201.393%203.514%201.753%204.861%201.068%202.223-1.713%202.811-3.867%203.399-6.374.077-.846.056-1.469.054-1.537zm-4.835%204.313c-.054.305-.156.586-.242.629-.034-.007-.131-.022-.307-.157-.145-.111-.314-.478-.456-.908.221.121.432.25.675.355.115.039.219.051.33.081zm-2.251-1.238c-.05.33-.158.648-.252.694-.022.001-.125-.018-.307-.157-.217-.166-.488-.906-.639-1.573.358.344.754.693%201.198%201.036zm-3.887-2.337c-.006-.116-.018-.231-.041-.342.635.145%201.189.368%201.599.625.097.231.166.481.174.642-.03.049-.055.101-.067.158-.046.013-.128.026-.298.004-.278-.037-.901-.57-1.367-1.087zm-1.127-.497c.116.306.176.625.12.71-.019.014-.117.045-.345.016-.206-.027-.604-.332-.986-.695.41-.051.816-.056%201.211-.031zm-4.535%201.535c.209.22.379.47.358.598-.006.041-.088.138-.351.234-.144.055-.539-.063-.979-.259a11.66%2011.66%200%200%200%20.972-.573zm.983-.664c.359-.237.738-.418%201.126-.554.25.237.479.548.457.694-.006.042-.087.138-.351.235-.174.064-.694-.105-1.232-.375zm-3.381%201.794c-.022.145-.061.29-.149.401-.133.166-.358.248-.69.251h-.002c-.133%200-.306-.26-.45-.621.417.091.854.07%201.291-.031zm-2.066-8.077a4.78%204.78%200%200%201-.775-.584c.172-.115.505-.254.88-.378l-.105.962zm-.331%202.302a10.32%2010.32%200%200%201-.828-.502c.202-.143.576-.328.984-.49l-.156.992zm-.45%202.157l-.701-.403c.214-.115.536-.249.891-.376a11.57%2011.57%200%200%201-.19.779zm-.181%201.716c.064.398.194.702.298.893-.194-.051-.435-.162-.736-.398.061-.119.224-.3.438-.495zM8.87%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zm-.735-.389a1.15%201.15%200%200%200-.314.783%201.16%201.16%200%200%200%201.162%201.162c.457%200%20.842-.27%201.032-.653.026.117.042.238.042.362a1.68%201.68%200%200%201-1.679%201.679%201.68%201.68%200%200%201-1.679-1.679c0-.843.626-1.535%201.436-1.654zM5.059%205.406A1.68%201.68%200%200%201%203.38%207.085a1.68%201.68%200%200%201-1.679-1.679c0-.037.009-.072.011-.109.21.3.541.508.935.508a1.16%201.16%200%200%200%201.162-1.162%201.14%201.14%200%200%200-.474-.912c.015%200%20.03-.005.045-.005.926.001%201.679.754%201.679%201.68zM3.198%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zM1.375%208.964c0-.52.103-1.035.288-1.52.466.394%201.06.64%201.717.64%201.144%200%202.116-.725%202.499-1.738.383%201.012%201.355%201.738%202.499%201.738.867%200%201.631-.421%202.121-1.062.307.605.478%201.267.478%201.942%200%202.486-2.153%204.51-4.801%204.51s-4.801-2.023-4.801-4.51zm24.342%2019.349c-.985.498-2.267.168-3.813-.979-3.073-2.281-5.453-3.199-7.813-.705-1.315%201.391-4.163%203.365-8.423.97-3.174-1.786-2.239-6.266-1.261-9.479l.146-.492c.276-1.02.395-2.457.444-3.268a6.11%206.11%200%200%200%201.18.115%206.01%206.01%200%200%200%202.536-.562l-.006.175c-.802.215-1.848.612-2.021%201.25-.079.295.021.601.274.837.219.203.415.364.598.501-.667.304-1.243.698-1.311%201.179-.02.144-.022.507.393.787.213.144.395.26.564.365-1.285.521-1.361.96-1.381%201.126-.018.142-.011.496.427.746l.854.489c-.473.389-.971.914-.999%201.429-.018.278.095.532.316.713.675.556%201.231.721%201.653.721.059%200%20.104-.014.158-.02.207.707.641%201.64%201.513%201.64h.013c.8-.008%201.236-.345%201.462-.626.173-.216.268-.457.325-.692.424.195.93.374%201.372.374.151%200%20.294-.021.423-.068.732-.27.944-.704.993-1.021.009-.061.003-.119.002-.179.266.086.538.147.789.147.15%200%20.294-.021.423-.069.542-.2.797-.489.914-.754.237.147.478.258.704.288.106.014.205.021.296.021.356%200%20.595-.101.767-.229.438.435%201.094.992%201.656%201.067.106.014.205.021.296.021a1.56%201.56%200%200%200%20.323-.035c.17.575.453%201.289.866%201.605.358.273.665.362.914.362a.99.99%200%200%200%20.421-.093%201.03%201.03%200%200%200%20.245-.164c.168.428.39.846.68%201.068.358.273.665.362.913.362a.99.99%200%200%200%20.421-.093c.317-.148.512-.448.639-.762.251.157.495.257.726.257.127%200%20.25-.024.37-.071.427-.17.706-.617.841-1.314.022-.015.047-.022.068-.038.067-.051.133-.104.196-.159-.443%201.486-1.107%202.761-2.086%203.257zM8.66%209.925a.5.5%200%201%200-1%200c0%20.653-.818%201.205-1.787%201.205s-1.787-.552-1.787-1.205a.5.5%200%201%200-1%200c0%201.216%201.25%202.205%202.787%202.205s2.787-.989%202.787-2.205zm4.4%2015.965l-.208.097c-2.661%201.258-4.708%201.436-6.086.527-1.542-1.017-1.88-3.19-1.844-4.198a.4.4%200%200%200-.385-.414c-.242-.029-.406.164-.414.385-.046%201.249.367%203.686%202.202%204.896.708.467%201.547.7%202.51.7%201.248%200%202.706-.392%204.362-1.174l.185-.086a.4.4%200%200%200%20.205-.527c-.089-.204-.326-.291-.527-.206zM9.547%202.292c.093.077.205.114.317.114a.5.5%200%200%200%20.318-.886L8.817.397a.5.5%200%200%200-.703.068.5.5%200%200%200%20.069.703l1.364%201.124zm-7.661-.065c.086%200%20.173-.022.253-.068l1.523-.893a.5.5%200%200%200-.506-.863l-1.523.892a.5.5%200%200%200-.179.685c.094.158.261.247.432.247z%22%20transform%3D%22matrix%28-1%200%200%201%2058%200%29%22%20fill%3D%22%233bb300%22/%3E%3Cpath%20d%3D%22M.3%2021.86V10.18q0-.46.02-.68.04-.22.18-.5.28-.54%201.34-.54%201.06%200%201.42.28.38.26.44.78.76-1.04%202.38-1.04%201.64%200%203.1%201.54%201.46%201.54%201.46%203.58%200%202.04-1.46%203.58-1.44%201.54-3.08%201.54-1.64%200-2.38-.92v4.04q0%20.46-.04.68-.02.22-.18.5-.14.3-.5.42-.36.12-.98.12-.62%200-1-.12-.36-.12-.52-.4-.14-.28-.18-.5-.02-.22-.02-.68zm3.96-9.42q-.46.54-.46%201.18%200%20.64.46%201.18.48.52%201.2.52.74%200%201.24-.52.52-.52.52-1.18%200-.66-.48-1.18-.48-.54-1.26-.54-.76%200-1.22.54zm14.741-8.36q.16-.3.54-.42.38-.12%201-.12.64%200%201.02.12.38.12.52.42.16.3.18.54.04.22.04.68v11.94q0%20.46-.04.7-.02.22-.18.5-.3.54-1.7.54-1.38%200-1.54-.98-.84.96-2.34.96-1.8%200-3.28-1.56-1.48-1.58-1.48-3.66%200-2.1%201.48-3.68%201.5-1.58%203.28-1.58%201.48%200%202.3%201v-4.2q0-.46.02-.68.04-.24.18-.52zm-3.24%2010.86q.52.54%201.26.54.74%200%201.22-.54.5-.54.5-1.18%200-.66-.48-1.22-.46-.56-1.26-.56-.8%200-1.28.56-.48.54-.48%201.2%200%20.66.52%201.2zm7.833-1.2q0-2.4%201.68-3.96%201.68-1.56%203.84-1.56%202.16%200%203.82%201.56%201.66%201.54%201.66%203.94%200%201.66-.86%202.96-.86%201.28-2.1%201.9-1.22.6-2.54.6-1.32%200-2.56-.64-1.24-.66-2.1-1.92-.84-1.28-.84-2.88zm4.18%201.44q.64.48%201.3.48.66%200%201.32-.5.66-.5.66-1.48%200-.98-.62-1.46-.62-.48-1.34-.48-.72%200-1.34.5-.62.5-.62%201.48%200%20.96.64%201.46zm11.412-1.44q0%20.84.56%201.32.56.46%201.18.46.64%200%201.18-.36.56-.38.9-.38.6%200%201.46%201.06.46.58.46%201.04%200%20.76-1.1%201.42-1.14.8-2.8.8-1.86%200-3.58-1.34-.82-.64-1.34-1.7-.52-1.08-.52-2.36%200-1.3.52-2.34.52-1.06%201.34-1.7%201.66-1.32%203.54-1.32.76%200%201.48.22.72.2%201.06.4l.32.2q.36.24.56.38.52.4.52.92%200%20.5-.42%201.14-.72%201.1-1.38%201.1-.38%200-1.08-.44-.36-.34-1.04-.34-.66%200-1.24.48-.58.48-.58%201.34z%22%20fill%3D%22green%22/%3E%3C/svg%3E"/>
+        </a>
+</div>
+    </nav>
+    <main class="pdoc">
+            <section class="module-info">
+                    <h1 class="modulename">
+<a href="./../../../outrank.html">outrank</a><wbr>.<a href="./../../algorithms.html">algorithms</a><wbr>.<a href="./../sketches.html">sketches</a><wbr>.counting_counters_ordinary    </h1>
+
+                
+                        <input id="mod-counting_counters_ordinary-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+
+                        <label class="view-source-button" for="mod-counting_counters_ordinary-view-source"><span>View Source</span></label>
+
+                        <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos"> 1</span></a><span class="kn">from</span> <span class="nn">__future__</span> <span class="kn">import</span> <span class="n">annotations</span>
+</span><span id="L-2"><a href="#L-2"><span class="linenos"> 2</span></a>
+</span><span id="L-3"><a href="#L-3"><span class="linenos"> 3</span></a><span class="kn">from</span> <span class="nn">collections</span> <span class="kn">import</span> <span class="n">Counter</span>
+</span><span id="L-4"><a href="#L-4"><span class="linenos"> 4</span></a>
+</span><span id="L-5"><a href="#L-5"><span class="linenos"> 5</span></a>
+</span><span id="L-6"><a href="#L-6"><span class="linenos"> 6</span></a><span class="k">class</span> <span class="nc">PrimitiveConstrainedCounter</span><span class="p">:</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos"> 7</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-8"><a href="#L-8"><span class="linenos"> 8</span></a><span class="sd">    A memory-efficient implementation of the count min sketch algorithm with optimized hashing using Numba JIT.</span>
+</span><span id="L-9"><a href="#L-9"><span class="linenos"> 9</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos">10</span></a>
+</span><span id="L-11"><a href="#L-11"><span class="linenos">11</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">bound</span><span class="p">:</span> <span class="nb">int</span><span class="o">=</span><span class="p">(</span><span class="mi">10</span><span class="o">**</span><span class="mi">4</span><span class="p">)</span> <span class="o">*</span> <span class="mi">3</span><span class="p">):</span>
+</span><span id="L-12"><a href="#L-12"><span class="linenos">12</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">max_bound_thr</span> <span class="o">=</span> <span class="n">bound</span>
+</span><span id="L-13"><a href="#L-13"><span class="linenos">13</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span><span class="p">:</span> <span class="n">Counter</span> <span class="o">=</span> <span class="n">Counter</span><span class="p">()</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos">14</span></a>
+</span><span id="L-15"><a href="#L-15"><span class="linenos">15</span></a>    <span class="k">def</span> <span class="nf">batch_add</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">lst</span><span class="p">):</span>
+</span><span id="L-16"><a href="#L-16"><span class="linenos">16</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span><span class="p">)</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_bound_thr</span><span class="p">:</span>
+</span><span id="L-17"><a href="#L-17"><span class="linenos">17</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span> <span class="o">+</span> <span class="n">Counter</span><span class="p">(</span><span class="n">lst</span><span class="p">)</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos">18</span></a>
+</span><span id="L-19"><a href="#L-19"><span class="linenos">19</span></a>    <span class="k">def</span> <span class="nf">add</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">val</span><span class="p">):</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos">20</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span><span class="p">)</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_bound_thr</span><span class="p">:</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos">21</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span><span class="p">[</span><span class="n">val</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos">22</span></a>
+</span><span id="L-23"><a href="#L-23"><span class="linenos">23</span></a>
+</span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a><span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s1">&#39;__main__&#39;</span><span class="p">:</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a>    <span class="kn">from</span> <span class="nn">collections</span> <span class="kn">import</span> <span class="n">Counter</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a>
+</span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a>    <span class="n">depth</span> <span class="o">=</span> <span class="mi">8</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos">28</span></a>    <span class="n">width</span> <span class="o">=</span> <span class="mi">2</span><span class="o">**</span><span class="mi">22</span>
+</span><span id="L-29"><a href="#L-29"><span class="linenos">29</span></a>    <span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos">30</span></a>    <span class="n">cms</span> <span class="o">=</span> <span class="n">PrimitiveConstrainedCounter</span><span class="p">()</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos">31</span></a>
+</span><span id="L-32"><a href="#L-32"><span class="linenos">32</span></a>    <span class="n">items</span> <span class="o">=</span> <span class="p">[</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">5</span><span class="p">,</span> <span class="mi">2</span><span class="p">]</span> <span class="o">*</span> <span class="mi">10000</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos">33</span></a>    <span class="n">cms</span><span class="o">.</span><span class="n">batch_add</span><span class="p">(</span><span class="n">items</span><span class="p">)</span>  <span class="c1"># Use the batch_add function</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos">34</span></a>
+</span><span id="L-35"><a href="#L-35"><span class="linenos">35</span></a>    <span class="nb">print</span><span class="p">(</span><span class="n">Counter</span><span class="p">(</span><span class="n">items</span><span class="p">))</span>  <span class="c1"># Print the exact counts for comparison</span>
+</span></pre></div>
+
+
+            </section>
+                <section id="PrimitiveConstrainedCounter">
+                            <input id="PrimitiveConstrainedCounter-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">PrimitiveConstrainedCounter</span>:
+
+                <label class="view-source-button" for="PrimitiveConstrainedCounter-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#PrimitiveConstrainedCounter"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="PrimitiveConstrainedCounter-7"><a href="#PrimitiveConstrainedCounter-7"><span class="linenos"> 7</span></a><span class="k">class</span> <span class="nc">PrimitiveConstrainedCounter</span><span class="p">:</span>
+</span><span id="PrimitiveConstrainedCounter-8"><a href="#PrimitiveConstrainedCounter-8"><span class="linenos"> 8</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="PrimitiveConstrainedCounter-9"><a href="#PrimitiveConstrainedCounter-9"><span class="linenos"> 9</span></a><span class="sd">    A memory-efficient implementation of the count min sketch algorithm with optimized hashing using Numba JIT.</span>
+</span><span id="PrimitiveConstrainedCounter-10"><a href="#PrimitiveConstrainedCounter-10"><span class="linenos">10</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="PrimitiveConstrainedCounter-11"><a href="#PrimitiveConstrainedCounter-11"><span class="linenos">11</span></a>
+</span><span id="PrimitiveConstrainedCounter-12"><a href="#PrimitiveConstrainedCounter-12"><span class="linenos">12</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">bound</span><span class="p">:</span> <span class="nb">int</span><span class="o">=</span><span class="p">(</span><span class="mi">10</span><span class="o">**</span><span class="mi">4</span><span class="p">)</span> <span class="o">*</span> <span class="mi">3</span><span class="p">):</span>
+</span><span id="PrimitiveConstrainedCounter-13"><a href="#PrimitiveConstrainedCounter-13"><span class="linenos">13</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">max_bound_thr</span> <span class="o">=</span> <span class="n">bound</span>
+</span><span id="PrimitiveConstrainedCounter-14"><a href="#PrimitiveConstrainedCounter-14"><span class="linenos">14</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span><span class="p">:</span> <span class="n">Counter</span> <span class="o">=</span> <span class="n">Counter</span><span class="p">()</span>
+</span><span id="PrimitiveConstrainedCounter-15"><a href="#PrimitiveConstrainedCounter-15"><span class="linenos">15</span></a>
+</span><span id="PrimitiveConstrainedCounter-16"><a href="#PrimitiveConstrainedCounter-16"><span class="linenos">16</span></a>    <span class="k">def</span> <span class="nf">batch_add</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">lst</span><span class="p">):</span>
+</span><span id="PrimitiveConstrainedCounter-17"><a href="#PrimitiveConstrainedCounter-17"><span class="linenos">17</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span><span class="p">)</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_bound_thr</span><span class="p">:</span>
+</span><span id="PrimitiveConstrainedCounter-18"><a href="#PrimitiveConstrainedCounter-18"><span class="linenos">18</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span> <span class="o">+</span> <span class="n">Counter</span><span class="p">(</span><span class="n">lst</span><span class="p">)</span>
+</span><span id="PrimitiveConstrainedCounter-19"><a href="#PrimitiveConstrainedCounter-19"><span class="linenos">19</span></a>
+</span><span id="PrimitiveConstrainedCounter-20"><a href="#PrimitiveConstrainedCounter-20"><span class="linenos">20</span></a>    <span class="k">def</span> <span class="nf">add</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">val</span><span class="p">):</span>
+</span><span id="PrimitiveConstrainedCounter-21"><a href="#PrimitiveConstrainedCounter-21"><span class="linenos">21</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span><span class="p">)</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_bound_thr</span><span class="p">:</span>
+</span><span id="PrimitiveConstrainedCounter-22"><a href="#PrimitiveConstrainedCounter-22"><span class="linenos">22</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span><span class="p">[</span><span class="n">val</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>A memory-efficient implementation of the count min sketch algorithm with optimized hashing using Numba JIT.</p>
+</div>
+
+
+                            <div id="PrimitiveConstrainedCounter.__init__" class="classattr">
+                                        <input id="PrimitiveConstrainedCounter.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">PrimitiveConstrainedCounter</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">bound</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">30000</span></span>)</span>
+
+                <label class="view-source-button" for="PrimitiveConstrainedCounter.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#PrimitiveConstrainedCounter.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="PrimitiveConstrainedCounter.__init__-12"><a href="#PrimitiveConstrainedCounter.__init__-12"><span class="linenos">12</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">bound</span><span class="p">:</span> <span class="nb">int</span><span class="o">=</span><span class="p">(</span><span class="mi">10</span><span class="o">**</span><span class="mi">4</span><span class="p">)</span> <span class="o">*</span> <span class="mi">3</span><span class="p">):</span>
+</span><span id="PrimitiveConstrainedCounter.__init__-13"><a href="#PrimitiveConstrainedCounter.__init__-13"><span class="linenos">13</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">max_bound_thr</span> <span class="o">=</span> <span class="n">bound</span>
+</span><span id="PrimitiveConstrainedCounter.__init__-14"><a href="#PrimitiveConstrainedCounter.__init__-14"><span class="linenos">14</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span><span class="p">:</span> <span class="n">Counter</span> <span class="o">=</span> <span class="n">Counter</span><span class="p">()</span>
+</span></pre></div>
+
+
+    
+
+                            </div>
+                            <div id="PrimitiveConstrainedCounter.max_bound_thr" class="classattr">
+                                <div class="attr variable">
+            <span class="name">max_bound_thr</span>
+
+        
+    </div>
+    <a class="headerlink" href="#PrimitiveConstrainedCounter.max_bound_thr"></a>
+    
+    
+
+                            </div>
+                            <div id="PrimitiveConstrainedCounter.default_counter" class="classattr">
+                                <div class="attr variable">
+            <span class="name">default_counter</span><span class="annotation">: collections.Counter</span>
+
+        
+    </div>
+    <a class="headerlink" href="#PrimitiveConstrainedCounter.default_counter"></a>
+    
+    
+
+                            </div>
+                            <div id="PrimitiveConstrainedCounter.batch_add" class="classattr">
+                                        <input id="PrimitiveConstrainedCounter.batch_add-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">batch_add</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">lst</span></span><span class="return-annotation">):</span></span>
+
+                <label class="view-source-button" for="PrimitiveConstrainedCounter.batch_add-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#PrimitiveConstrainedCounter.batch_add"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="PrimitiveConstrainedCounter.batch_add-16"><a href="#PrimitiveConstrainedCounter.batch_add-16"><span class="linenos">16</span></a>    <span class="k">def</span> <span class="nf">batch_add</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">lst</span><span class="p">):</span>
+</span><span id="PrimitiveConstrainedCounter.batch_add-17"><a href="#PrimitiveConstrainedCounter.batch_add-17"><span class="linenos">17</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span><span class="p">)</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_bound_thr</span><span class="p">:</span>
+</span><span id="PrimitiveConstrainedCounter.batch_add-18"><a href="#PrimitiveConstrainedCounter.batch_add-18"><span class="linenos">18</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span> <span class="o">+</span> <span class="n">Counter</span><span class="p">(</span><span class="n">lst</span><span class="p">)</span>
+</span></pre></div>
+
+
+    
+
+                            </div>
+                            <div id="PrimitiveConstrainedCounter.add" class="classattr">
+                                        <input id="PrimitiveConstrainedCounter.add-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">add</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">val</span></span><span class="return-annotation">):</span></span>
+
+                <label class="view-source-button" for="PrimitiveConstrainedCounter.add-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#PrimitiveConstrainedCounter.add"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="PrimitiveConstrainedCounter.add-20"><a href="#PrimitiveConstrainedCounter.add-20"><span class="linenos">20</span></a>    <span class="k">def</span> <span class="nf">add</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">val</span><span class="p">):</span>
+</span><span id="PrimitiveConstrainedCounter.add-21"><a href="#PrimitiveConstrainedCounter.add-21"><span class="linenos">21</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span><span class="p">)</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_bound_thr</span><span class="p">:</span>
+</span><span id="PrimitiveConstrainedCounter.add-22"><a href="#PrimitiveConstrainedCounter.add-22"><span class="linenos">22</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">default_counter</span><span class="p">[</span><span class="n">val</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
+</span></pre></div>
+
+
+    
+
+                            </div>
+                </section>
+    </main>
+<script>
+    function escapeHTML(html) {
+        return document.createElement('div').appendChild(document.createTextNode(html)).parentNode.innerHTML;
+    }
+
+    const originalContent = document.querySelector("main.pdoc");
+    let currentContent = originalContent;
+
+    function setContent(innerHTML) {
+        let elem;
+        if (innerHTML) {
+            elem = document.createElement("main");
+            elem.classList.add("pdoc");
+            elem.innerHTML = innerHTML;
+        } else {
+            elem = originalContent;
+        }
+        if (currentContent !== elem) {
+            currentContent.replaceWith(elem);
+            currentContent = elem;
+        }
+    }
+
+    function getSearchTerm() {
+        return (new URL(window.location)).searchParams.get("search");
+    }
+
+    const searchBox = document.querySelector(".pdoc input[type=search]");
+    searchBox.addEventListener("input", function () {
+        let url = new URL(window.location);
+        if (searchBox.value.trim()) {
+            url.hash = "";
+            url.searchParams.set("search", searchBox.value);
+        } else {
+            url.searchParams.delete("search");
+        }
+        history.replaceState("", "", url.toString());
+        onInput();
+    });
+    window.addEventListener("popstate", onInput);
+
+
+    let search, searchErr;
+
+    async function initialize() {
+        try {
+            search = await new Promise((resolve, reject) => {
+                const script = document.createElement("script");
+                script.type = "text/javascript";
+                script.async = true;
+                script.onload = () => resolve(window.pdocSearch);
+                script.onerror = (e) => reject(e);
+                script.src = "../../../search.js";
+                document.getElementsByTagName("head")[0].appendChild(script);
+            });
+        } catch (e) {
+            console.error("Cannot fetch pdoc search index");
+            searchErr = "Cannot fetch search index.";
+        }
+        onInput();
+
+        document.querySelector("nav.pdoc").addEventListener("click", e => {
+            if (e.target.hash) {
+                searchBox.value = "";
+                searchBox.dispatchEvent(new Event("input"));
+            }
+        });
+    }
+
+    function onInput() {
+        setContent((() => {
+            const term = getSearchTerm();
+            if (!term) {
+                return null
+            }
+            if (searchErr) {
+                return `<h3>Error: ${searchErr}</h3>`
+            }
+            if (!search) {
+                return "<h3>Searching...</h3>"
+            }
+
+            window.scrollTo({top: 0, left: 0, behavior: 'auto'});
+
+            const results = search(term);
+
+            let html;
+            if (results.length === 0) {
+                html = `No search results for '${escapeHTML(term)}'.`
+            } else {
+                html = `<h4>${results.length} search result${results.length > 1 ? "s" : ""} for '${escapeHTML(term)}'.</h4>`;
+            }
+            for (let result of results.slice(0, 10)) {
+                let doc = result.doc;
+                let url = `../../../${doc.modulename.replaceAll(".", "/")}.html`;
+                if (doc.qualname) {
+                    url += `#${doc.qualname}`;
+                }
+
+                let heading;
+                switch (result.doc.kind) {
+                    case "function":
+                        if (doc.fullname.endsWith(".__init__")) {
+                            heading = `<span class="name">${doc.fullname.replace(/\.__init__$/, "")}</span>${doc.signature}`;
+                        } else {
+                            heading = `<span class="def">${doc.funcdef}</span> <span class="name">${doc.fullname}</span>${doc.signature}`;
+                        }
+                        break;
+                    case "class":
+                        heading = `<span class="def">class</span> <span class="name">${doc.fullname}</span>`;
+                        if (doc.bases)
+                            heading += `<wbr>(<span class="base">${doc.bases}</span>)`;
+                        heading += `:`;
+                        break;
+                    case "variable":
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        if (doc.annotation)
+                            heading += `<span class="annotation">${doc.annotation}</span>`;
+                        if (doc.default_value)
+                            heading += `<span class="default_value"> = ${doc.default_value}</span>`;
+                        break;
+                    default:
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        break;
+                }
+                html += `
+                        <section class="search-result">
+                        <a href="${url}" class="attr ${doc.kind}">${heading}</a>
+                        <div class="docstring">${doc.doc}</div>
+                        </section>
+                    `;
+
+            }
+            return html;
+        })());
+    }
+
+    if (getSearchTerm()) {
+        initialize();
+        searchBox.value = getSearchTerm();
+        onInput();
+    } else {
+        searchBox.addEventListener("focus", initialize, {once: true});
+    }
+
+    searchBox.addEventListener("keydown", e => {
+        if (["ArrowDown", "ArrowUp", "Enter"].includes(e.key)) {
+            let focused = currentContent.querySelector(".search-result.focused");
+            if (!focused) {
+                currentContent.querySelector(".search-result").classList.add("focused");
+            } else if (
+                e.key === "ArrowDown"
+                && focused.nextElementSibling
+                && focused.nextElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.nextElementSibling.classList.add("focused");
+                focused.nextElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "ArrowUp"
+                && focused.previousElementSibling
+                && focused.previousElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.previousElementSibling.classList.add("focused");
+                focused.previousElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "Enter"
+            ) {
+                focused.querySelector("a").click();
+            }
+        }
+    });
+</script></body>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/algorithms/sketches/counting_ultiloglog.html b/docs/outrank/algorithms/sketches/counting_ultiloglog.html
index d326f96..5ce74b8 100644
--- a/docs/outrank/algorithms/sketches/counting_ultiloglog.html
+++ b/docs/outrank/algorithms/sketches/counting_ultiloglog.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.algorithms.sketches.counting_ultiloglog API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -267,7 +267,7 @@ <h1 class="modulename">
                 <section id="HyperLogLogWCache">
                             <input id="HyperLogLogWCache-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr class">
-
+            
     <span class="def">class</span>
     <span class="name">HyperLogLogWCache</span>:
 
@@ -328,12 +328,12 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                             <div id="HyperLogLogWCache.__init__" class="classattr">
                                         <input id="HyperLogLogWCache.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="name">HyperLogLogWCache</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">error_rate</span><span class="o">=</span><span class="mf">0.005</span></span>)</span>
 
                 <label class="view-source-button" for="HyperLogLogWCache.__init__-view-source"><span>View Source</span></label>
@@ -351,79 +351,79 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                             </div>
                             <div id="HyperLogLogWCache.p" class="classattr">
                                 <div class="attr variable">
             <span class="name">p</span>
 
-
+        
     </div>
     <a class="headerlink" href="#HyperLogLogWCache.p"></a>
-
-
+    
+    
 
                             </div>
                             <div id="HyperLogLogWCache.m" class="classattr">
                                 <div class="attr variable">
             <span class="name">m</span>
 
-
+        
     </div>
     <a class="headerlink" href="#HyperLogLogWCache.m"></a>
-
-
+    
+    
 
                             </div>
                             <div id="HyperLogLogWCache.warmup_set" class="classattr">
                                 <div class="attr variable">
             <span class="name">warmup_set</span>
 
-
+        
     </div>
     <a class="headerlink" href="#HyperLogLogWCache.warmup_set"></a>
-
-
+    
+    
 
                             </div>
                             <div id="HyperLogLogWCache.warmup_size" class="classattr">
                                 <div class="attr variable">
             <span class="name">warmup_size</span>
 
-
+        
     </div>
     <a class="headerlink" href="#HyperLogLogWCache.warmup_size"></a>
-
-
+    
+    
 
                             </div>
                             <div id="HyperLogLogWCache.width" class="classattr">
                                 <div class="attr variable">
             <span class="name">width</span>
 
-
+        
     </div>
     <a class="headerlink" href="#HyperLogLogWCache.width"></a>
-
-
+    
+    
 
                             </div>
                             <div id="HyperLogLogWCache.hll_flag" class="classattr">
                                 <div class="attr variable">
             <span class="name">hll_flag</span>
 
-
+        
     </div>
     <a class="headerlink" href="#HyperLogLogWCache.hll_flag"></a>
-
-
+    
+    
 
                             </div>
                             <div id="HyperLogLogWCache.add" class="classattr">
                                         <input id="HyperLogLogWCache.add-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">add</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">value</span></span><span class="return-annotation">):</span></span>
 
@@ -446,7 +446,7 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                             </div>
                 </section>
@@ -633,4 +633,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/algorithms/synthetic_data_generators.html b/docs/outrank/algorithms/synthetic_data_generators.html
index 0a2063c..b72db12 100644
--- a/docs/outrank/algorithms/synthetic_data_generators.html
+++ b/docs/outrank/algorithms/synthetic_data_generators.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.algorithms.synthetic_data_generators API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -29,6 +29,7 @@
 
             <h2>Submodules</h2>
             <ul>
+                    <li><a href="synthetic_data_generators/cc_generator.html">cc_generator</a></li>
                     <li><a href="synthetic_data_generators/generator_naive.html">generator_naive</a></li>
             </ul>
 
@@ -46,10 +47,10 @@ <h2>Submodules</h2>
                     <h1 class="modulename">
 <a href="./../../outrank.html">outrank</a><wbr>.<a href="./../algorithms.html">algorithms</a><wbr>.synthetic_data_generators    </h1>
 
-
-
-
-
+                
+                
+                
+                
             </section>
     </main>
 <script>
@@ -234,4 +235,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/algorithms/synthetic_data_generators/cc_generator.html b/docs/outrank/algorithms/synthetic_data_generators/cc_generator.html
new file mode 100644
index 0000000..7d97838
--- /dev/null
+++ b/docs/outrank/algorithms/synthetic_data_generators/cc_generator.html
@@ -0,0 +1,2832 @@
+<!doctype html>
+<html lang="en">
+<head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="pdoc 14.5.1"/>
+    <title>outrank.algorithms.synthetic_data_generators.cc_generator API documentation</title>
+
+    <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
+    <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
+    <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! custom.css */</style></head>
+<body>
+    <nav class="pdoc">
+        <label id="navtoggle" for="togglestate" class="pdoc-button"><svg xmlns='http://www.w3.org/2000/svg' viewBox='0 0 30 30'><path stroke-linecap='round' stroke="currentColor" stroke-miterlimit='10' stroke-width='2' d='M4 7h22M4 15h22M4 23h22'/></svg></label>
+        <input id="togglestate" type="checkbox" aria-hidden="true" tabindex="-1">
+        <div>            <a class="pdoc-button module-list-button" href="../synthetic_data_generators.html">
+<svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" fill="currentColor" class="bi bi-box-arrow-in-left" viewBox="0 0 16 16">
+  <path fill-rule="evenodd" d="M10 3.5a.5.5 0 0 0-.5-.5h-8a.5.5 0 0 0-.5.5v9a.5.5 0 0 0 .5.5h8a.5.5 0 0 0 .5-.5v-2a.5.5 0 0 1 1 0v2A1.5 1.5 0 0 1 9.5 14h-8A1.5 1.5 0 0 1 0 12.5v-9A1.5 1.5 0 0 1 1.5 2h8A1.5 1.5 0 0 1 11 3.5v2a.5.5 0 0 1-1 0v-2z"/>
+  <path fill-rule="evenodd" d="M4.146 8.354a.5.5 0 0 1 0-.708l3-3a.5.5 0 1 1 .708.708L5.707 7.5H14.5a.5.5 0 0 1 0 1H5.707l2.147 2.146a.5.5 0 0 1-.708.708l-3-3z"/>
+</svg>                &nbsp;outrank.algorithms.synthetic_data_generators</a>
+
+
+            <input type="search" placeholder="Search..." role="searchbox" aria-label="search"
+                   pattern=".+" required>
+
+
+
+            <h2>API Documentation</h2>
+                <ul class="memberlist">
+            <li>
+                    <a class="class" href="#CategoricalClassification">CategoricalClassification</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="variable" href="#CategoricalClassification.dataset_info">dataset_info</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#CategoricalClassification.generate_data">generate_data</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#CategoricalClassification.generate_combinations">generate_combinations</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#CategoricalClassification.generate_correlated">generate_correlated</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#CategoricalClassification.generate_duplicates">generate_duplicates</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#CategoricalClassification.generate_labels">generate_labels</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#CategoricalClassification.generate_noise">generate_noise</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#CategoricalClassification.downsample_dataset">downsample_dataset</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#CategoricalClassification.print_dataset">print_dataset</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#CategoricalClassification.summarize">summarize</a>
+                        </li>
+                </ul>
+
+            </li>
+    </ul>
+
+
+
+        <a class="attribution" title="pdoc: Python API documentation generator" href="https://pdoc.dev" target="_blank">
+            built with <span class="visually-hidden">pdoc</span><img
+                alt="pdoc logo"
+                src="data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20role%3D%22img%22%20aria-label%3D%22pdoc%20logo%22%20width%3D%22300%22%20height%3D%22150%22%20viewBox%3D%22-1%200%2060%2030%22%3E%3Ctitle%3Epdoc%3C/title%3E%3Cpath%20d%3D%22M29.621%2021.293c-.011-.273-.214-.475-.511-.481a.5.5%200%200%200-.489.503l-.044%201.393c-.097.551-.695%201.215-1.566%201.704-.577.428-1.306.486-2.193.182-1.426-.617-2.467-1.654-3.304-2.487l-.173-.172a3.43%203.43%200%200%200-.365-.306.49.49%200%200%200-.286-.196c-1.718-1.06-4.931-1.47-7.353.191l-.219.15c-1.707%201.187-3.413%202.131-4.328%201.03-.02-.027-.49-.685-.141-1.763.233-.721.546-2.408.772-4.076.042-.09.067-.187.046-.288.166-1.347.277-2.625.241-3.351%201.378-1.008%202.271-2.586%202.271-4.362%200-.976-.272-1.935-.788-2.774-.057-.094-.122-.18-.184-.268.033-.167.052-.339.052-.516%200-1.477-1.202-2.679-2.679-2.679-.791%200-1.496.352-1.987.9a6.3%206.3%200%200%200-1.001.029c-.492-.564-1.207-.929-2.012-.929-1.477%200-2.679%201.202-2.679%202.679A2.65%202.65%200%200%200%20.97%206.554c-.383.747-.595%201.572-.595%202.41%200%202.311%201.507%204.29%203.635%205.107-.037.699-.147%202.27-.423%203.294l-.137.461c-.622%202.042-2.515%208.257%201.727%2010.643%201.614.908%203.06%201.248%204.317%201.248%202.665%200%204.492-1.524%205.322-2.401%201.476-1.559%202.886-1.854%206.491.82%201.877%201.393%203.514%201.753%204.861%201.068%202.223-1.713%202.811-3.867%203.399-6.374.077-.846.056-1.469.054-1.537zm-4.835%204.313c-.054.305-.156.586-.242.629-.034-.007-.131-.022-.307-.157-.145-.111-.314-.478-.456-.908.221.121.432.25.675.355.115.039.219.051.33.081zm-2.251-1.238c-.05.33-.158.648-.252.694-.022.001-.125-.018-.307-.157-.217-.166-.488-.906-.639-1.573.358.344.754.693%201.198%201.036zm-3.887-2.337c-.006-.116-.018-.231-.041-.342.635.145%201.189.368%201.599.625.097.231.166.481.174.642-.03.049-.055.101-.067.158-.046.013-.128.026-.298.004-.278-.037-.901-.57-1.367-1.087zm-1.127-.497c.116.306.176.625.12.71-.019.014-.117.045-.345.016-.206-.027-.604-.332-.986-.695.41-.051.816-.056%201.211-.031zm-4.535%201.535c.209.22.379.47.358.598-.006.041-.088.138-.351.234-.144.055-.539-.063-.979-.259a11.66%2011.66%200%200%200%20.972-.573zm.983-.664c.359-.237.738-.418%201.126-.554.25.237.479.548.457.694-.006.042-.087.138-.351.235-.174.064-.694-.105-1.232-.375zm-3.381%201.794c-.022.145-.061.29-.149.401-.133.166-.358.248-.69.251h-.002c-.133%200-.306-.26-.45-.621.417.091.854.07%201.291-.031zm-2.066-8.077a4.78%204.78%200%200%201-.775-.584c.172-.115.505-.254.88-.378l-.105.962zm-.331%202.302a10.32%2010.32%200%200%201-.828-.502c.202-.143.576-.328.984-.49l-.156.992zm-.45%202.157l-.701-.403c.214-.115.536-.249.891-.376a11.57%2011.57%200%200%201-.19.779zm-.181%201.716c.064.398.194.702.298.893-.194-.051-.435-.162-.736-.398.061-.119.224-.3.438-.495zM8.87%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zm-.735-.389a1.15%201.15%200%200%200-.314.783%201.16%201.16%200%200%200%201.162%201.162c.457%200%20.842-.27%201.032-.653.026.117.042.238.042.362a1.68%201.68%200%200%201-1.679%201.679%201.68%201.68%200%200%201-1.679-1.679c0-.843.626-1.535%201.436-1.654zM5.059%205.406A1.68%201.68%200%200%201%203.38%207.085a1.68%201.68%200%200%201-1.679-1.679c0-.037.009-.072.011-.109.21.3.541.508.935.508a1.16%201.16%200%200%200%201.162-1.162%201.14%201.14%200%200%200-.474-.912c.015%200%20.03-.005.045-.005.926.001%201.679.754%201.679%201.68zM3.198%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zM1.375%208.964c0-.52.103-1.035.288-1.52.466.394%201.06.64%201.717.64%201.144%200%202.116-.725%202.499-1.738.383%201.012%201.355%201.738%202.499%201.738.867%200%201.631-.421%202.121-1.062.307.605.478%201.267.478%201.942%200%202.486-2.153%204.51-4.801%204.51s-4.801-2.023-4.801-4.51zm24.342%2019.349c-.985.498-2.267.168-3.813-.979-3.073-2.281-5.453-3.199-7.813-.705-1.315%201.391-4.163%203.365-8.423.97-3.174-1.786-2.239-6.266-1.261-9.479l.146-.492c.276-1.02.395-2.457.444-3.268a6.11%206.11%200%200%200%201.18.115%206.01%206.01%200%200%200%202.536-.562l-.006.175c-.802.215-1.848.612-2.021%201.25-.079.295.021.601.274.837.219.203.415.364.598.501-.667.304-1.243.698-1.311%201.179-.02.144-.022.507.393.787.213.144.395.26.564.365-1.285.521-1.361.96-1.381%201.126-.018.142-.011.496.427.746l.854.489c-.473.389-.971.914-.999%201.429-.018.278.095.532.316.713.675.556%201.231.721%201.653.721.059%200%20.104-.014.158-.02.207.707.641%201.64%201.513%201.64h.013c.8-.008%201.236-.345%201.462-.626.173-.216.268-.457.325-.692.424.195.93.374%201.372.374.151%200%20.294-.021.423-.068.732-.27.944-.704.993-1.021.009-.061.003-.119.002-.179.266.086.538.147.789.147.15%200%20.294-.021.423-.069.542-.2.797-.489.914-.754.237.147.478.258.704.288.106.014.205.021.296.021.356%200%20.595-.101.767-.229.438.435%201.094.992%201.656%201.067.106.014.205.021.296.021a1.56%201.56%200%200%200%20.323-.035c.17.575.453%201.289.866%201.605.358.273.665.362.914.362a.99.99%200%200%200%20.421-.093%201.03%201.03%200%200%200%20.245-.164c.168.428.39.846.68%201.068.358.273.665.362.913.362a.99.99%200%200%200%20.421-.093c.317-.148.512-.448.639-.762.251.157.495.257.726.257.127%200%20.25-.024.37-.071.427-.17.706-.617.841-1.314.022-.015.047-.022.068-.038.067-.051.133-.104.196-.159-.443%201.486-1.107%202.761-2.086%203.257zM8.66%209.925a.5.5%200%201%200-1%200c0%20.653-.818%201.205-1.787%201.205s-1.787-.552-1.787-1.205a.5.5%200%201%200-1%200c0%201.216%201.25%202.205%202.787%202.205s2.787-.989%202.787-2.205zm4.4%2015.965l-.208.097c-2.661%201.258-4.708%201.436-6.086.527-1.542-1.017-1.88-3.19-1.844-4.198a.4.4%200%200%200-.385-.414c-.242-.029-.406.164-.414.385-.046%201.249.367%203.686%202.202%204.896.708.467%201.547.7%202.51.7%201.248%200%202.706-.392%204.362-1.174l.185-.086a.4.4%200%200%200%20.205-.527c-.089-.204-.326-.291-.527-.206zM9.547%202.292c.093.077.205.114.317.114a.5.5%200%200%200%20.318-.886L8.817.397a.5.5%200%200%200-.703.068.5.5%200%200%200%20.069.703l1.364%201.124zm-7.661-.065c.086%200%20.173-.022.253-.068l1.523-.893a.5.5%200%200%200-.506-.863l-1.523.892a.5.5%200%200%200-.179.685c.094.158.261.247.432.247z%22%20transform%3D%22matrix%28-1%200%200%201%2058%200%29%22%20fill%3D%22%233bb300%22/%3E%3Cpath%20d%3D%22M.3%2021.86V10.18q0-.46.02-.68.04-.22.18-.5.28-.54%201.34-.54%201.06%200%201.42.28.38.26.44.78.76-1.04%202.38-1.04%201.64%200%203.1%201.54%201.46%201.54%201.46%203.58%200%202.04-1.46%203.58-1.44%201.54-3.08%201.54-1.64%200-2.38-.92v4.04q0%20.46-.04.68-.02.22-.18.5-.14.3-.5.42-.36.12-.98.12-.62%200-1-.12-.36-.12-.52-.4-.14-.28-.18-.5-.02-.22-.02-.68zm3.96-9.42q-.46.54-.46%201.18%200%20.64.46%201.18.48.52%201.2.52.74%200%201.24-.52.52-.52.52-1.18%200-.66-.48-1.18-.48-.54-1.26-.54-.76%200-1.22.54zm14.741-8.36q.16-.3.54-.42.38-.12%201-.12.64%200%201.02.12.38.12.52.42.16.3.18.54.04.22.04.68v11.94q0%20.46-.04.7-.02.22-.18.5-.3.54-1.7.54-1.38%200-1.54-.98-.84.96-2.34.96-1.8%200-3.28-1.56-1.48-1.58-1.48-3.66%200-2.1%201.48-3.68%201.5-1.58%203.28-1.58%201.48%200%202.3%201v-4.2q0-.46.02-.68.04-.24.18-.52zm-3.24%2010.86q.52.54%201.26.54.74%200%201.22-.54.5-.54.5-1.18%200-.66-.48-1.22-.46-.56-1.26-.56-.8%200-1.28.56-.48.54-.48%201.2%200%20.66.52%201.2zm7.833-1.2q0-2.4%201.68-3.96%201.68-1.56%203.84-1.56%202.16%200%203.82%201.56%201.66%201.54%201.66%203.94%200%201.66-.86%202.96-.86%201.28-2.1%201.9-1.22.6-2.54.6-1.32%200-2.56-.64-1.24-.66-2.1-1.92-.84-1.28-.84-2.88zm4.18%201.44q.64.48%201.3.48.66%200%201.32-.5.66-.5.66-1.48%200-.98-.62-1.46-.62-.48-1.34-.48-.72%200-1.34.5-.62.5-.62%201.48%200%20.96.64%201.46zm11.412-1.44q0%20.84.56%201.32.56.46%201.18.46.64%200%201.18-.36.56-.38.9-.38.6%200%201.46%201.06.46.58.46%201.04%200%20.76-1.1%201.42-1.14.8-2.8.8-1.86%200-3.58-1.34-.82-.64-1.34-1.7-.52-1.08-.52-2.36%200-1.3.52-2.34.52-1.06%201.34-1.7%201.66-1.32%203.54-1.32.76%200%201.48.22.72.2%201.06.4l.32.2q.36.24.56.38.52.4.52.92%200%20.5-.42%201.14-.72%201.1-1.38%201.1-.38%200-1.08-.44-.36-.34-1.04-.34-.66%200-1.24.48-.58.48-.58%201.34z%22%20fill%3D%22green%22/%3E%3C/svg%3E"/>
+        </a>
+</div>
+    </nav>
+    <main class="pdoc">
+            <section class="module-info">
+                    <h1 class="modulename">
+<a href="./../../../outrank.html">outrank</a><wbr>.<a href="./../../algorithms.html">algorithms</a><wbr>.<a href="./../synthetic_data_generators.html">synthetic_data_generators</a><wbr>.cc_generator    </h1>
+
+                
+                        <input id="mod-cc_generator-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+
+                        <label class="view-source-button" for="mod-cc_generator-view-source"><span>View Source</span></label>
+
+                        <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos">  1</span></a><span class="kn">from</span> <span class="nn">__future__</span> <span class="kn">import</span> <span class="n">annotations</span>
+</span><span id="L-2"><a href="#L-2"><span class="linenos">  2</span></a>
+</span><span id="L-3"><a href="#L-3"><span class="linenos">  3</span></a><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">List</span>
+</span><span id="L-4"><a href="#L-4"><span class="linenos">  4</span></a><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Literal</span>
+</span><span id="L-5"><a href="#L-5"><span class="linenos">  5</span></a><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Optional</span>
+</span><span id="L-6"><a href="#L-6"><span class="linenos">  6</span></a><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Tuple</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos">  7</span></a><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Union</span>
+</span><span id="L-8"><a href="#L-8"><span class="linenos">  8</span></a>
+</span><span id="L-9"><a href="#L-9"><span class="linenos">  9</span></a><span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos"> 10</span></a><span class="kn">from</span> <span class="nn">numpy.typing</span> <span class="kn">import</span> <span class="n">ArrayLike</span>
+</span><span id="L-11"><a href="#L-11"><span class="linenos"> 11</span></a><span class="kn">from</span> <span class="nn">scipy.linalg</span> <span class="kn">import</span> <span class="n">qr</span>
+</span><span id="L-12"><a href="#L-12"><span class="linenos"> 12</span></a><span class="kn">from</span> <span class="nn">scipy.stats</span> <span class="kn">import</span> <span class="n">norm</span>
+</span><span id="L-13"><a href="#L-13"><span class="linenos"> 13</span></a><span class="kn">from</span> <span class="nn">sklearn.cluster</span> <span class="kn">import</span> <span class="n">KMeans</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos"> 14</span></a><span class="kn">from</span> <span class="nn">sklearn.utils</span> <span class="kn">import</span> <span class="n">resample</span>
+</span><span id="L-15"><a href="#L-15"><span class="linenos"> 15</span></a>
+</span><span id="L-16"><a href="#L-16"><span class="linenos"> 16</span></a>
+</span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a><span class="k">class</span> <span class="nc">CategoricalClassification</span><span class="p">:</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a>
+</span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a>            <span class="s1">&#39;general&#39;</span><span class="p">:</span> <span class="p">{},</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a>            <span class="s1">&#39;combinations&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a>            <span class="s1">&#39;correlations&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a>            <span class="s1">&#39;duplicates&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a>            <span class="s1">&#39;labels&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a>            <span class="s1">&#39;noise&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a>        <span class="p">}</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a>
+</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a>    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a>        <span class="k">return</span> <span class="sa">f</span><span class="s2">&quot;CategoricalClassification(dataset_info=</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="si">}</span><span class="s2">)&quot;</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a>
+</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a>    <span class="k">def</span> <span class="nf">generate_data</span><span class="p">(</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a>        <span class="n">n_features</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a>        <span class="n">n_samples</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a>        <span class="n">cardinality</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a>        <span class="n">structure</span><span class="p">:</span> <span class="nb">list</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a>
+</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a><span class="sd">        Generates dataset based on given parameters</span>
+</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a><span class="sd">        :param n_features: number of generated features</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a><span class="sd">        :param n_samples: number of generated samples</span>
+</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a><span class="sd">        :param cardinality: default cardinality of the dataset</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a><span class="sd">        :param structure: structure of the dataset</span>
+</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a><span class="sd">        :param ensure_rep: flag, ensures all given values represented</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a><span class="sd">        :param random_values: flag, enables random (integer) feature values from set [low, high]</span>
+</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a><span class="sd">        :param low: sets lower bound of random feature values</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a><span class="sd">        :param high: sets high bound of random feature values</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a><span class="sd">        :param seed: sets seed of numpy random</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a><span class="sd">        :return: X, 2D dataset</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a>
+</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>            <span class="s1">&#39;general&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a>                <span class="s1">&#39;n_features&#39;</span><span class="p">:</span> <span class="n">n_features</span><span class="p">,</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a>                <span class="s1">&#39;n_samples&#39;</span><span class="p">:</span> <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a>                <span class="s1">&#39;cardinality&#39;</span><span class="p">:</span> <span class="n">cardinality</span><span class="p">,</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a>                <span class="s1">&#39;structure&#39;</span><span class="p">:</span> <span class="n">structure</span><span class="p">,</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>                <span class="s1">&#39;ensure_rep&#39;</span><span class="p">:</span> <span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a>                <span class="s1">&#39;seed&#39;</span><span class="p">:</span> <span class="n">seed</span><span class="p">,</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a>            <span class="p">},</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a>        <span class="p">})</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a>
+</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">seed</span><span class="p">(</span><span class="n">seed</span><span class="p">)</span>
+</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>        <span class="n">X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">empty</span><span class="p">([</span><span class="n">n_features</span><span class="p">,</span> <span class="n">n_samples</span><span class="p">])</span>
+</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a>
+</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a>        <span class="k">if</span> <span class="n">structure</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a>            <span class="c1"># No specific structure parameter passed</span>
+</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
+</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a>                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a>                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a>                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a>                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a>                <span class="p">)</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a>                <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>            <span class="c1"># Structure parameter passed, building based on structure</span>
+</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a>            <span class="n">ix</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a>            <span class="k">for</span> <span class="n">data</span> <span class="ow">in</span> <span class="n">structure</span><span class="p">:</span>
+</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a>                <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">data</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a>                    <span class="c1"># Data in structure is a tuple of (feature index (integer), feature attributes)</span>
+</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a>                    <span class="n">feature_ix</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
+</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a>
+</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a>                    <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
+</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a>                        <span class="c1"># Filling out the dataset up to column index feature_ix</span>
+</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a>                        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
+</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a>                            <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a>                                <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a>                                <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>                                <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a>                                <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a>                                <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a>                                <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a>                            <span class="p">)</span>
+</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a>                            <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>                            <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a>
+</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
+</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a>                        <span class="n">feature_attributes</span><span class="p">,</span>
+</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a>                    <span class="p">)</span>
+</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a>                    <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a>
+</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a>                    <span class="c1"># Data in structure is a tuple of (list of feature indexes, feature attributes)</span>
+</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a>                    <span class="n">feature_ixs</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
+</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a>
+</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a>                    <span class="k">for</span> <span class="n">feature_ix</span> <span class="ow">in</span> <span class="n">feature_ixs</span><span class="p">:</span>
+</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a>                        <span class="c1"># Filling out the dataset up to feature_ix</span>
+</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>                        <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
+</span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>                            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
+</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a>                                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a>                                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a>                                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a>                                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a>                                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a>                                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a>                                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a>                                <span class="p">)</span>
+</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a>                                <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a>                                <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a>
+</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a>                        <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
+</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a>                            <span class="n">feature_attributes</span><span class="p">,</span>
+</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a>                            <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a>                            <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a>                            <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a>                            <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a>                            <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a>                        <span class="p">)</span>
+</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a>
+</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a>                        <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a>                        <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a>
+</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a>            <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">n_features</span><span class="p">:</span>
+</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a>                <span class="c1"># Fill out the rest of the dataset</span>
+</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">n_features</span><span class="p">):</span>
+</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a>                        <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a>                    <span class="p">)</span>
+</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a>
+</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a>        <span class="k">return</span> <span class="n">X</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a>
+</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a>    <span class="k">def</span> <span class="nf">_configure_generate_feature</span><span class="p">(</span>
+</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a>        <span class="n">feature_attributes</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">list</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>        <span class="n">n_samples</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
+</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
+</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a>
+</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a><span class="sd">        Helper function, calls _generate_feature with appropriate parameters based on feature_attributes</span>
+</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a><span class="sd">        :param feature_attributes: either integer (cardinality) or list of feature attributes</span>
+</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a><span class="sd">        :param n_samples: number of samples in dataset</span>
+</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a><span class="sd">        :param ensure_rep: ensures all values are represented at least once in the feature vector</span>
+</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a><span class="sd">        :param random_values: randomly picked values for vec if true, otherwise values range from [low, cardinality] with by 1</span>
+</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a><span class="sd">        :param low: lower bound of random feature vector values</span>
+</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a><span class="sd">        :param high: upper bound of random feature vector values</span>
+</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a><span class="sd">        :return: feature vector</span>
+</span><span id="L-183"><a href="#L-183"><span class="linenos">183</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a>
+</span><span id="L-185"><a href="#L-185"><span class="linenos">185</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_attributes</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a>            <span class="c1"># feature_cardinality is just an integer, generate feature either with random values or</span>
+</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a>            <span class="c1"># [low, low+cardinality]</span>
+</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a>            <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a>                <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a>                <span class="n">cardinality</span><span class="o">=</span><span class="n">feature_attributes</span><span class="p">,</span>
+</span><span id="L-191"><a href="#L-191"><span class="linenos">191</span></a>                <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a>                <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a>                <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a>                <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a>            <span class="p">)</span>
+</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a>            <span class="c1"># feature_cardinality is a list of [value_domain, value_frequencies]</span>
+</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a>            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_attributes</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a>                <span class="n">value_domain</span><span class="p">,</span> <span class="n">value_frequencies</span> <span class="o">=</span> <span class="n">feature_attributes</span>
+</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a>                    <span class="n">vec</span><span class="o">=</span><span class="n">value_domain</span><span class="p">,</span>
+</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a>                    <span class="n">p</span><span class="o">=</span><span class="n">value_frequencies</span><span class="p">,</span>
+</span><span id="L-205"><a href="#L-205"><span class="linenos">205</span></a>                <span class="p">)</span>
+</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a>                <span class="c1"># feature_cardinality is value_domain (list of values for feature)</span>
+</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a>                <span class="n">value_domain</span> <span class="o">=</span> <span class="n">feature_attributes</span>
+</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a>                    <span class="n">vec</span><span class="o">=</span><span class="n">value_domain</span><span class="p">,</span>
+</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a>                <span class="p">)</span>
+</span><span id="L-214"><a href="#L-214"><span class="linenos">214</span></a>
+</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a>        <span class="k">return</span> <span class="n">x</span>
+</span><span id="L-216"><a href="#L-216"><span class="linenos">216</span></a>
+</span><span id="L-217"><a href="#L-217"><span class="linenos">217</span></a>    <span class="k">def</span> <span class="nf">_generate_feature</span><span class="p">(</span>
+</span><span id="L-218"><a href="#L-218"><span class="linenos">218</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-219"><a href="#L-219"><span class="linenos">219</span></a>        <span class="n">size</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-220"><a href="#L-220"><span class="linenos">220</span></a>        <span class="n">vec</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-221"><a href="#L-221"><span class="linenos">221</span></a>        <span class="n">cardinality</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
+</span><span id="L-222"><a href="#L-222"><span class="linenos">222</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-223"><a href="#L-223"><span class="linenos">223</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-224"><a href="#L-224"><span class="linenos">224</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
+</span><span id="L-225"><a href="#L-225"><span class="linenos">225</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
+</span><span id="L-226"><a href="#L-226"><span class="linenos">226</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-227"><a href="#L-227"><span class="linenos">227</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-228"><a href="#L-228"><span class="linenos">228</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-229"><a href="#L-229"><span class="linenos">229</span></a><span class="sd">        Generates feature vector of length size. Default probability density distribution is approximately normal, centred around a randomly picked value.</span>
+</span><span id="L-230"><a href="#L-230"><span class="linenos">230</span></a><span class="sd">        :param vec: list of feature values</span>
+</span><span id="L-231"><a href="#L-231"><span class="linenos">231</span></a><span class="sd">        :param cardinality: single value cardinality</span>
+</span><span id="L-232"><a href="#L-232"><span class="linenos">232</span></a><span class="sd">        :param size: length of feature vector</span>
+</span><span id="L-233"><a href="#L-233"><span class="linenos">233</span></a><span class="sd">        :param ensure_rep: ensures all values are represented at least once in the feature vector</span>
+</span><span id="L-234"><a href="#L-234"><span class="linenos">234</span></a><span class="sd">        :param random_values: randomly picked values for vec if true, otherwise values range from [low, cardinality] with by 1</span>
+</span><span id="L-235"><a href="#L-235"><span class="linenos">235</span></a><span class="sd">        :param low: lower bound of random feature vector values</span>
+</span><span id="L-236"><a href="#L-236"><span class="linenos">236</span></a><span class="sd">        :param high: upper bound of random feature vector values</span>
+</span><span id="L-237"><a href="#L-237"><span class="linenos">237</span></a><span class="sd">        :param p: list of probabilities of each value</span>
+</span><span id="L-238"><a href="#L-238"><span class="linenos">238</span></a><span class="sd">        :return: feature vector x</span>
+</span><span id="L-239"><a href="#L-239"><span class="linenos">239</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-240"><a href="#L-240"><span class="linenos">240</span></a>
+</span><span id="L-241"><a href="#L-241"><span class="linenos">241</span></a>        <span class="k">if</span> <span class="n">vec</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-242"><a href="#L-242"><span class="linenos">242</span></a>            <span class="k">if</span> <span class="n">random_values</span><span class="p">:</span>
+</span><span id="L-243"><a href="#L-243"><span class="linenos">243</span></a>                <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="n">low</span><span class="p">,</span> <span class="n">high</span> <span class="o">+</span> <span class="mi">1</span><span class="p">),</span> <span class="n">cardinality</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="L-244"><a href="#L-244"><span class="linenos">244</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="L-245"><a href="#L-245"><span class="linenos">245</span></a>                <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">low</span><span class="p">,</span> <span class="n">low</span> <span class="o">+</span> <span class="n">cardinality</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="L-246"><a href="#L-246"><span class="linenos">246</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-247"><a href="#L-247"><span class="linenos">247</span></a>            <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">vec</span><span class="p">)</span>
+</span><span id="L-248"><a href="#L-248"><span class="linenos">248</span></a>
+</span><span id="L-249"><a href="#L-249"><span class="linenos">249</span></a>        <span class="k">if</span> <span class="n">p</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-250"><a href="#L-250"><span class="linenos">250</span></a>            <span class="n">v_shift</span> <span class="o">=</span> <span class="n">vec</span> <span class="o">-</span> <span class="n">vec</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">))]</span>
+</span><span id="L-251"><a href="#L-251"><span class="linenos">251</span></a>            <span class="n">p</span> <span class="o">=</span> <span class="n">norm</span><span class="o">.</span><span class="n">pdf</span><span class="p">(</span><span class="n">v_shift</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="mi">3</span><span class="p">)</span>
+</span><span id="L-252"><a href="#L-252"><span class="linenos">252</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-253"><a href="#L-253"><span class="linenos">253</span></a>            <span class="n">p</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">p</span><span class="p">)</span>
+</span><span id="L-254"><a href="#L-254"><span class="linenos">254</span></a>
+</span><span id="L-255"><a href="#L-255"><span class="linenos">255</span></a>        <span class="n">p</span> <span class="o">=</span> <span class="n">p</span> <span class="o">/</span> <span class="n">p</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span>
+</span><span id="L-256"><a href="#L-256"><span class="linenos">256</span></a>
+</span><span id="L-257"><a href="#L-257"><span class="linenos">257</span></a>        <span class="k">if</span> <span class="n">ensure_rep</span> <span class="ow">and</span> <span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">)</span> <span class="o">&lt;</span> <span class="n">size</span><span class="p">:</span>
+</span><span id="L-258"><a href="#L-258"><span class="linenos">258</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">vec</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="p">(</span><span class="n">size</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">)),</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">)</span>
+</span><span id="L-259"><a href="#L-259"><span class="linenos">259</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">sampled_values</span><span class="p">,</span> <span class="n">vec</span><span class="p">)</span>
+</span><span id="L-260"><a href="#L-260"><span class="linenos">260</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-261"><a href="#L-261"><span class="linenos">261</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">vec</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="n">size</span><span class="p">,</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">)</span>
+</span><span id="L-262"><a href="#L-262"><span class="linenos">262</span></a>
+</span><span id="L-263"><a href="#L-263"><span class="linenos">263</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">sampled_values</span><span class="p">)</span>
+</span><span id="L-264"><a href="#L-264"><span class="linenos">264</span></a>        <span class="k">return</span> <span class="n">sampled_values</span>
+</span><span id="L-265"><a href="#L-265"><span class="linenos">265</span></a>
+</span><span id="L-266"><a href="#L-266"><span class="linenos">266</span></a>    <span class="k">def</span> <span class="nf">generate_combinations</span><span class="p">(</span>
+</span><span id="L-267"><a href="#L-267"><span class="linenos">267</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-268"><a href="#L-268"><span class="linenos">268</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-269"><a href="#L-269"><span class="linenos">269</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-270"><a href="#L-270"><span class="linenos">270</span></a>        <span class="n">combination_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-271"><a href="#L-271"><span class="linenos">271</span></a>        <span class="n">combination_type</span><span class="p">:</span> <span class="n">Literal</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
+</span><span id="L-272"><a href="#L-272"><span class="linenos">272</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-273"><a href="#L-273"><span class="linenos">273</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-274"><a href="#L-274"><span class="linenos">274</span></a><span class="sd">        Generates linear, nonlinear, or custom combinations within feature vectors in given dataset X</span>
+</span><span id="L-275"><a href="#L-275"><span class="linenos">275</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="L-276"><a href="#L-276"><span class="linenos">276</span></a><span class="sd">        :param feature_indices: indexes of features to be in combination</span>
+</span><span id="L-277"><a href="#L-277"><span class="linenos">277</span></a><span class="sd">        :param combination_function: optional custom function for combining feature vectors</span>
+</span><span id="L-278"><a href="#L-278"><span class="linenos">278</span></a><span class="sd">        :param combination_type: string flag, either liner or nonlinear, defining combination type</span>
+</span><span id="L-279"><a href="#L-279"><span class="linenos">279</span></a><span class="sd">        :return: X with added resultant feature</span>
+</span><span id="L-280"><a href="#L-280"><span class="linenos">280</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-281"><a href="#L-281"><span class="linenos">281</span></a>
+</span><span id="L-282"><a href="#L-282"><span class="linenos">282</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="L-283"><a href="#L-283"><span class="linenos">283</span></a>
+</span><span id="L-284"><a href="#L-284"><span class="linenos">284</span></a>        <span class="k">if</span> <span class="n">combination_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-285"><a href="#L-285"><span class="linenos">285</span></a>            <span class="k">if</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
+</span><span id="L-286"><a href="#L-286"><span class="linenos">286</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-287"><a href="#L-287"><span class="linenos">287</span></a>            <span class="k">elif</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
+</span><span id="L-288"><a href="#L-288"><span class="linenos">288</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="L-289"><a href="#L-289"><span class="linenos">289</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-290"><a href="#L-290"><span class="linenos">290</span></a>            <span class="n">combination_type</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">combination_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
+</span><span id="L-291"><a href="#L-291"><span class="linenos">291</span></a>
+</span><span id="L-292"><a href="#L-292"><span class="linenos">292</span></a>        <span class="n">combination_result</span> <span class="o">=</span> <span class="n">combination_function</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
+</span><span id="L-293"><a href="#L-293"><span class="linenos">293</span></a>
+</span><span id="L-294"><a href="#L-294"><span class="linenos">294</span></a>        <span class="n">combination_ix</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="L-295"><a href="#L-295"><span class="linenos">295</span></a>
+</span><span id="L-296"><a href="#L-296"><span class="linenos">296</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="L-297"><a href="#L-297"><span class="linenos">297</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="L-298"><a href="#L-298"><span class="linenos">298</span></a>            <span class="s1">&#39;combination_type&#39;</span><span class="p">:</span> <span class="n">combination_type</span><span class="p">,</span>
+</span><span id="L-299"><a href="#L-299"><span class="linenos">299</span></a>            <span class="s1">&#39;combination_ix&#39;</span><span class="p">:</span> <span class="n">combination_ix</span><span class="p">,</span>
+</span><span id="L-300"><a href="#L-300"><span class="linenos">300</span></a>        <span class="p">})</span>
+</span><span id="L-301"><a href="#L-301"><span class="linenos">301</span></a>
+</span><span id="L-302"><a href="#L-302"><span class="linenos">302</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">combination_result</span><span class="p">))</span>
+</span><span id="L-303"><a href="#L-303"><span class="linenos">303</span></a>
+</span><span id="L-304"><a href="#L-304"><span class="linenos">304</span></a>    <span class="k">def</span> <span class="nf">_xor</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-305"><a href="#L-305"><span class="linenos">305</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-306"><a href="#L-306"><span class="linenos">306</span></a><span class="sd">        Performs bitwise XOR operation on two integer arrays</span>
+</span><span id="L-307"><a href="#L-307"><span class="linenos">307</span></a><span class="sd">        :param arr: features to perform XOR operation on</span>
+</span><span id="L-308"><a href="#L-308"><span class="linenos">308</span></a><span class="sd">        :return: bitwise XOR result</span>
+</span><span id="L-309"><a href="#L-309"><span class="linenos">309</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-310"><a href="#L-310"><span class="linenos">310</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-311"><a href="#L-311"><span class="linenos">311</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="L-312"><a href="#L-312"><span class="linenos">312</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="L-313"><a href="#L-313"><span class="linenos">313</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="L-314"><a href="#L-314"><span class="linenos">314</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
+</span><span id="L-315"><a href="#L-315"><span class="linenos">315</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
+</span><span id="L-316"><a href="#L-316"><span class="linenos">316</span></a>
+</span><span id="L-317"><a href="#L-317"><span class="linenos">317</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-318"><a href="#L-318"><span class="linenos">318</span></a>
+</span><span id="L-319"><a href="#L-319"><span class="linenos">319</span></a>    <span class="k">def</span> <span class="nf">_and</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-320"><a href="#L-320"><span class="linenos">320</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-321"><a href="#L-321"><span class="linenos">321</span></a><span class="sd">        Performs bitwise AND operation on two integer arrays</span>
+</span><span id="L-322"><a href="#L-322"><span class="linenos">322</span></a><span class="sd">        :param arr: features to perform AND operation on</span>
+</span><span id="L-323"><a href="#L-323"><span class="linenos">323</span></a><span class="sd">        :return: bitwise AND result</span>
+</span><span id="L-324"><a href="#L-324"><span class="linenos">324</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-325"><a href="#L-325"><span class="linenos">325</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-326"><a href="#L-326"><span class="linenos">326</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="L-327"><a href="#L-327"><span class="linenos">327</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="L-328"><a href="#L-328"><span class="linenos">328</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="L-329"><a href="#L-329"><span class="linenos">329</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
+</span><span id="L-330"><a href="#L-330"><span class="linenos">330</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_and</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
+</span><span id="L-331"><a href="#L-331"><span class="linenos">331</span></a>
+</span><span id="L-332"><a href="#L-332"><span class="linenos">332</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-333"><a href="#L-333"><span class="linenos">333</span></a>
+</span><span id="L-334"><a href="#L-334"><span class="linenos">334</span></a>    <span class="k">def</span> <span class="nf">_or</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-335"><a href="#L-335"><span class="linenos">335</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-336"><a href="#L-336"><span class="linenos">336</span></a><span class="sd">        Performs bitwise OR operation on two integer arrays</span>
+</span><span id="L-337"><a href="#L-337"><span class="linenos">337</span></a><span class="sd">        :param arr: features to perform OR operation on</span>
+</span><span id="L-338"><a href="#L-338"><span class="linenos">338</span></a><span class="sd">        :return: bitwise OR result</span>
+</span><span id="L-339"><a href="#L-339"><span class="linenos">339</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-340"><a href="#L-340"><span class="linenos">340</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-341"><a href="#L-341"><span class="linenos">341</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="L-342"><a href="#L-342"><span class="linenos">342</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="L-343"><a href="#L-343"><span class="linenos">343</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="L-344"><a href="#L-344"><span class="linenos">344</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
+</span><span id="L-345"><a href="#L-345"><span class="linenos">345</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_or</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
+</span><span id="L-346"><a href="#L-346"><span class="linenos">346</span></a>
+</span><span id="L-347"><a href="#L-347"><span class="linenos">347</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-348"><a href="#L-348"><span class="linenos">348</span></a>
+</span><span id="L-349"><a href="#L-349"><span class="linenos">349</span></a>    <span class="k">def</span> <span class="nf">generate_correlated</span><span class="p">(</span>
+</span><span id="L-350"><a href="#L-350"><span class="linenos">350</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-351"><a href="#L-351"><span class="linenos">351</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-352"><a href="#L-352"><span class="linenos">352</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-353"><a href="#L-353"><span class="linenos">353</span></a>        <span class="n">r</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.8</span><span class="p">,</span>
+</span><span id="L-354"><a href="#L-354"><span class="linenos">354</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-355"><a href="#L-355"><span class="linenos">355</span></a>
+</span><span id="L-356"><a href="#L-356"><span class="linenos">356</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-357"><a href="#L-357"><span class="linenos">357</span></a><span class="sd">        Generates correlated features using the given feature indices. Correlation is based on cosine of angle between vectors with mean 0.</span>
+</span><span id="L-358"><a href="#L-358"><span class="linenos">358</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="L-359"><a href="#L-359"><span class="linenos">359</span></a><span class="sd">        :param feature_indices: indices of features to generate correlated feature to</span>
+</span><span id="L-360"><a href="#L-360"><span class="linenos">360</span></a><span class="sd">        :param r: (Pearson) correlation factor</span>
+</span><span id="L-361"><a href="#L-361"><span class="linenos">361</span></a><span class="sd">        :return: X with generated correlated  features</span>
+</span><span id="L-362"><a href="#L-362"><span class="linenos">362</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-363"><a href="#L-363"><span class="linenos">363</span></a>
+</span><span id="L-364"><a href="#L-364"><span class="linenos">364</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="L-365"><a href="#L-365"><span class="linenos">365</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
+</span><span id="L-366"><a href="#L-366"><span class="linenos">366</span></a>
+</span><span id="L-367"><a href="#L-367"><span class="linenos">367</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="L-368"><a href="#L-368"><span class="linenos">368</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)),</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="L-369"><a href="#L-369"><span class="linenos">369</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-370"><a href="#L-370"><span class="linenos">370</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="L-371"><a href="#L-371"><span class="linenos">371</span></a>
+</span><span id="L-372"><a href="#L-372"><span class="linenos">372</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="L-373"><a href="#L-373"><span class="linenos">373</span></a>        <span class="n">transposed</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
+</span><span id="L-374"><a href="#L-374"><span class="linenos">374</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-375"><a href="#L-375"><span class="linenos">375</span></a>
+</span><span id="L-376"><a href="#L-376"><span class="linenos">376</span></a>        <span class="k">for</span> <span class="n">t</span> <span class="ow">in</span> <span class="n">transposed</span><span class="p">:</span>
+</span><span id="L-377"><a href="#L-377"><span class="linenos">377</span></a>            <span class="n">theta</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arccos</span><span class="p">(</span><span class="n">r</span><span class="p">)</span>
+</span><span id="L-378"><a href="#L-378"><span class="linenos">378</span></a>            <span class="n">t_standard</span> <span class="o">=</span> <span class="p">(</span><span class="n">t</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">t</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">t</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
+</span><span id="L-379"><a href="#L-379"><span class="linenos">379</span></a>
+</span><span id="L-380"><a href="#L-380"><span class="linenos">380</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">normal</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">t_standard</span><span class="p">))</span>
+</span><span id="L-381"><a href="#L-381"><span class="linenos">381</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="p">(</span><span class="n">rand</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">rand</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">rand</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
+</span><span id="L-382"><a href="#L-382"><span class="linenos">382</span></a>
+</span><span id="L-383"><a href="#L-383"><span class="linenos">383</span></a>            <span class="n">M</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">t_standard</span><span class="p">,</span> <span class="n">rand</span><span class="p">))</span>
+</span><span id="L-384"><a href="#L-384"><span class="linenos">384</span></a>            <span class="n">M_centred</span> <span class="o">=</span> <span class="p">(</span><span class="n">M</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">M</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))</span>
+</span><span id="L-385"><a href="#L-385"><span class="linenos">385</span></a>
+</span><span id="L-386"><a href="#L-386"><span class="linenos">386</span></a>            <span class="n">Id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">eye</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">t</span><span class="p">))</span>
+</span><span id="L-387"><a href="#L-387"><span class="linenos">387</span></a>            <span class="n">Q</span> <span class="o">=</span> <span class="n">qr</span><span class="p">(</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="p">[</span><span class="mi">0</span><span class="p">]],</span> <span class="n">mode</span><span class="o">=</span><span class="s1">&#39;economic&#39;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="L-388"><a href="#L-388"><span class="linenos">388</span></a>            <span class="n">P</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Q</span><span class="p">,</span> <span class="n">Q</span><span class="o">.</span><span class="n">T</span><span class="p">)</span>
+</span><span id="L-389"><a href="#L-389"><span class="linenos">389</span></a>            <span class="n">orthogonal_projection</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Id</span> <span class="o">-</span> <span class="n">P</span><span class="p">,</span> <span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">])</span>
+</span><span id="L-390"><a href="#L-390"><span class="linenos">390</span></a>            <span class="n">M_orthogonal</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">],</span> <span class="n">orthogonal_projection</span><span class="p">))</span>
+</span><span id="L-391"><a href="#L-391"><span class="linenos">391</span></a>
+</span><span id="L-392"><a href="#L-392"><span class="linenos">392</span></a>            <span class="n">Y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">M_orthogonal</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">M_orthogonal</span> <span class="o">**</span> <span class="mi">2</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))))</span>
+</span><span id="L-393"><a href="#L-393"><span class="linenos">393</span></a>            <span class="n">corr</span> <span class="o">=</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">tan</span><span class="p">(</span><span class="n">theta</span><span class="p">))</span> <span class="o">*</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">]</span>
+</span><span id="L-394"><a href="#L-394"><span class="linenos">394</span></a>
+</span><span id="L-395"><a href="#L-395"><span class="linenos">395</span></a>            <span class="n">correlated_features</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">corr</span><span class="p">)</span>
+</span><span id="L-396"><a href="#L-396"><span class="linenos">396</span></a>
+</span><span id="L-397"><a href="#L-397"><span class="linenos">397</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">correlated_features</span><span class="p">)</span>
+</span><span id="L-398"><a href="#L-398"><span class="linenos">398</span></a>
+</span><span id="L-399"><a href="#L-399"><span class="linenos">399</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="L-400"><a href="#L-400"><span class="linenos">400</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="L-401"><a href="#L-401"><span class="linenos">401</span></a>            <span class="s1">&#39;correlated_indices&#39;</span><span class="p">:</span> <span class="n">correlated_ixs</span><span class="p">,</span>
+</span><span id="L-402"><a href="#L-402"><span class="linenos">402</span></a>            <span class="s1">&#39;correlation_factor&#39;</span><span class="p">:</span> <span class="n">r</span><span class="p">,</span>
+</span><span id="L-403"><a href="#L-403"><span class="linenos">403</span></a>        <span class="p">})</span>
+</span><span id="L-404"><a href="#L-404"><span class="linenos">404</span></a>
+</span><span id="L-405"><a href="#L-405"><span class="linenos">405</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">correlated_features</span><span class="p">))</span>
+</span><span id="L-406"><a href="#L-406"><span class="linenos">406</span></a>
+</span><span id="L-407"><a href="#L-407"><span class="linenos">407</span></a>    <span class="k">def</span> <span class="nf">generate_duplicates</span><span class="p">(</span>
+</span><span id="L-408"><a href="#L-408"><span class="linenos">408</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-409"><a href="#L-409"><span class="linenos">409</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-410"><a href="#L-410"><span class="linenos">410</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-411"><a href="#L-411"><span class="linenos">411</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-412"><a href="#L-412"><span class="linenos">412</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-413"><a href="#L-413"><span class="linenos">413</span></a><span class="sd">        Generates duplicate features</span>
+</span><span id="L-414"><a href="#L-414"><span class="linenos">414</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="L-415"><a href="#L-415"><span class="linenos">415</span></a><span class="sd">        :param feature_indices: indices of features to duplicate</span>
+</span><span id="L-416"><a href="#L-416"><span class="linenos">416</span></a><span class="sd">        :return: dataset with duplicated features</span>
+</span><span id="L-417"><a href="#L-417"><span class="linenos">417</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-418"><a href="#L-418"><span class="linenos">418</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="L-419"><a href="#L-419"><span class="linenos">419</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
+</span><span id="L-420"><a href="#L-420"><span class="linenos">420</span></a>
+</span><span id="L-421"><a href="#L-421"><span class="linenos">421</span></a>        <span class="n">duplicated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">),</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="L-422"><a href="#L-422"><span class="linenos">422</span></a>
+</span><span id="L-423"><a href="#L-423"><span class="linenos">423</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="L-424"><a href="#L-424"><span class="linenos">424</span></a>
+</span><span id="L-425"><a href="#L-425"><span class="linenos">425</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="L-426"><a href="#L-426"><span class="linenos">426</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="L-427"><a href="#L-427"><span class="linenos">427</span></a>            <span class="s1">&#39;duplicate_indices&#39;</span><span class="p">:</span> <span class="n">duplicated_ixs</span><span class="p">,</span>
+</span><span id="L-428"><a href="#L-428"><span class="linenos">428</span></a>        <span class="p">})</span>
+</span><span id="L-429"><a href="#L-429"><span class="linenos">429</span></a>
+</span><span id="L-430"><a href="#L-430"><span class="linenos">430</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">selected_features</span><span class="p">))</span>
+</span><span id="L-431"><a href="#L-431"><span class="linenos">431</span></a>
+</span><span id="L-432"><a href="#L-432"><span class="linenos">432</span></a>    <span class="k">def</span> <span class="nf">generate_labels</span><span class="p">(</span>
+</span><span id="L-433"><a href="#L-433"><span class="linenos">433</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-434"><a href="#L-434"><span class="linenos">434</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-435"><a href="#L-435"><span class="linenos">435</span></a>        <span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
+</span><span id="L-436"><a href="#L-436"><span class="linenos">436</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">|</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">=</span> <span class="mf">0.5</span><span class="p">,</span>
+</span><span id="L-437"><a href="#L-437"><span class="linenos">437</span></a>        <span class="n">k</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
+</span><span id="L-438"><a href="#L-438"><span class="linenos">438</span></a>        <span class="n">decision_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-439"><a href="#L-439"><span class="linenos">439</span></a>        <span class="n">class_relation</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
+</span><span id="L-440"><a href="#L-440"><span class="linenos">440</span></a>        <span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-441"><a href="#L-441"><span class="linenos">441</span></a>    <span class="p">):</span>
+</span><span id="L-442"><a href="#L-442"><span class="linenos">442</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-443"><a href="#L-443"><span class="linenos">443</span></a><span class="sd">        Generates labels for dataset X</span>
+</span><span id="L-444"><a href="#L-444"><span class="linenos">444</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="L-445"><a href="#L-445"><span class="linenos">445</span></a><span class="sd">        :param n: number of class labels</span>
+</span><span id="L-446"><a href="#L-446"><span class="linenos">446</span></a><span class="sd">        :param p: class distribution</span>
+</span><span id="L-447"><a href="#L-447"><span class="linenos">447</span></a><span class="sd">        :param k: constant</span>
+</span><span id="L-448"><a href="#L-448"><span class="linenos">448</span></a><span class="sd">        :param decision_function: optional user-defined decision function</span>
+</span><span id="L-449"><a href="#L-449"><span class="linenos">449</span></a><span class="sd">        :param class_relation: string, either &#39;linear&#39;, &#39;nonlinear&#39;, or &#39;cluster&#39;</span>
+</span><span id="L-450"><a href="#L-450"><span class="linenos">450</span></a><span class="sd">        :param balance: boolean, whether to balance clustering class labels</span>
+</span><span id="L-451"><a href="#L-451"><span class="linenos">451</span></a><span class="sd">        :return: array of labels, corresponding to dataset X</span>
+</span><span id="L-452"><a href="#L-452"><span class="linenos">452</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-453"><a href="#L-453"><span class="linenos">453</span></a>
+</span><span id="L-454"><a href="#L-454"><span class="linenos">454</span></a>        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="L-455"><a href="#L-455"><span class="linenos">455</span></a>            <span class="k">if</span> <span class="nb">sum</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;sum of values in must be less than 1.0&#39;</span><span class="p">)</span>
+</span><span id="L-456"><a href="#L-456"><span class="linenos">456</span></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">n</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;length of p must equal n&#39;</span><span class="p">)</span>
+</span><span id="L-457"><a href="#L-457"><span class="linenos">457</span></a>
+</span><span id="L-458"><a href="#L-458"><span class="linenos">458</span></a>        <span class="k">if</span> <span class="n">p</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;p must be less than 1.0&#39;</span><span class="p">)</span>
+</span><span id="L-459"><a href="#L-459"><span class="linenos">459</span></a>
+</span><span id="L-460"><a href="#L-460"><span class="linenos">460</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="L-461"><a href="#L-461"><span class="linenos">461</span></a>
+</span><span id="L-462"><a href="#L-462"><span class="linenos">462</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-463"><a href="#L-463"><span class="linenos">463</span></a>            <span class="k">if</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
+</span><span id="L-464"><a href="#L-464"><span class="linenos">464</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="n">x</span> <span class="o">+</span> <span class="mi">3</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-465"><a href="#L-465"><span class="linenos">465</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
+</span><span id="L-466"><a href="#L-466"><span class="linenos">466</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="o">+</span> <span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">cos</span><span class="p">(</span><span class="n">x</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-467"><a href="#L-467"><span class="linenos">467</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;cluster&#39;</span><span class="p">:</span>
+</span><span id="L-468"><a href="#L-468"><span class="linenos">468</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="L-469"><a href="#L-469"><span class="linenos">469</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-470"><a href="#L-470"><span class="linenos">470</span></a>            <span class="n">class_relation</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">decision_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
+</span><span id="L-471"><a href="#L-471"><span class="linenos">471</span></a>
+</span><span id="L-472"><a href="#L-472"><span class="linenos">472</span></a>        <span class="n">y</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-473"><a href="#L-473"><span class="linenos">473</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-474"><a href="#L-474"><span class="linenos">474</span></a>            <span class="k">if</span> <span class="n">n</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="L-475"><a href="#L-475"><span class="linenos">475</span></a>                <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">list</span><span class="p">:</span>
+</span><span id="L-476"><a href="#L-476"><span class="linenos">476</span></a>                    <span class="n">p</span> <span class="o">=</span> <span class="mi">1</span> <span class="o">/</span> <span class="n">n</span>
+</span><span id="L-477"><a href="#L-477"><span class="linenos">477</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">]</span>
+</span><span id="L-478"><a href="#L-478"><span class="linenos">478</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="L-479"><a href="#L-479"><span class="linenos">479</span></a>                        <span class="n">percentiles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">))</span>
+</span><span id="L-480"><a href="#L-480"><span class="linenos">480</span></a>
+</span><span id="L-481"><a href="#L-481"><span class="linenos">481</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="L-482"><a href="#L-482"><span class="linenos">482</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
+</span><span id="L-483"><a href="#L-483"><span class="linenos">483</span></a>
+</span><span id="L-484"><a href="#L-484"><span class="linenos">484</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="L-485"><a href="#L-485"><span class="linenos">485</span></a>                    <span class="k">for</span> <span class="n">p_point</span> <span class="ow">in</span> <span class="n">p_points</span><span class="p">:</span>
+</span><span id="L-486"><a href="#L-486"><span class="linenos">486</span></a>                        <span class="n">y</span> <span class="o">+=</span> <span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">)</span>
+</span><span id="L-487"><a href="#L-487"><span class="linenos">487</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="L-488"><a href="#L-488"><span class="linenos">488</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="L-489"><a href="#L-489"><span class="linenos">489</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="o">*</span> <span class="mi">100</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">p</span><span class="p">]</span>
+</span><span id="L-490"><a href="#L-490"><span class="linenos">490</span></a>
+</span><span id="L-491"><a href="#L-491"><span class="linenos">491</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="L-492"><a href="#L-492"><span class="linenos">492</span></a>                        <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">+=</span> <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span>
+</span><span id="L-493"><a href="#L-493"><span class="linenos">493</span></a>
+</span><span id="L-494"><a href="#L-494"><span class="linenos">494</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">insert</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+</span><span id="L-495"><a href="#L-495"><span class="linenos">495</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">pop</span><span class="p">()</span>
+</span><span id="L-496"><a href="#L-496"><span class="linenos">496</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span>
+</span><span id="L-497"><a href="#L-497"><span class="linenos">497</span></a>
+</span><span id="L-498"><a href="#L-498"><span class="linenos">498</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
+</span><span id="L-499"><a href="#L-499"><span class="linenos">499</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">p_points</span><span class="p">)</span>
+</span><span id="L-500"><a href="#L-500"><span class="linenos">500</span></a>
+</span><span id="L-501"><a href="#L-501"><span class="linenos">501</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="L-502"><a href="#L-502"><span class="linenos">502</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span><span class="p">):</span>
+</span><span id="L-503"><a href="#L-503"><span class="linenos">503</span></a>                        <span class="n">p_point</span> <span class="o">=</span> <span class="n">p_points</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="L-504"><a href="#L-504"><span class="linenos">504</span></a>                        <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">)):</span>
+</span><span id="L-505"><a href="#L-505"><span class="linenos">505</span></a>                            <span class="k">if</span> <span class="n">decision_boundary</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">:</span>
+</span><span id="L-506"><a href="#L-506"><span class="linenos">506</span></a>                                <span class="n">y</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-507"><a href="#L-507"><span class="linenos">507</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="L-508"><a href="#L-508"><span class="linenos">508</span></a>                <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="L-509"><a href="#L-509"><span class="linenos">509</span></a>                <span class="n">p_point</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">)</span>
+</span><span id="L-510"><a href="#L-510"><span class="linenos">510</span></a>                <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+</span><span id="L-511"><a href="#L-511"><span class="linenos">511</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-512"><a href="#L-512"><span class="linenos">512</span></a>            <span class="k">if</span> <span class="n">p</span> <span class="o">==</span> <span class="mf">0.5</span><span class="p">:</span>
+</span><span id="L-513"><a href="#L-513"><span class="linenos">513</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="mf">1.0</span>
+</span><span id="L-514"><a href="#L-514"><span class="linenos">514</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="L-515"><a href="#L-515"><span class="linenos">515</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span><span class="p">,</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">p</span><span class="p">]</span>
+</span><span id="L-516"><a href="#L-516"><span class="linenos">516</span></a>            <span class="n">y</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_cluster_data</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">n</span><span class="p">,</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">,</span> <span class="n">balance</span><span class="o">=</span><span class="n">balance</span><span class="p">)</span>
+</span><span id="L-517"><a href="#L-517"><span class="linenos">517</span></a>
+</span><span id="L-518"><a href="#L-518"><span class="linenos">518</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="L-519"><a href="#L-519"><span class="linenos">519</span></a>            <span class="s1">&#39;labels&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="L-520"><a href="#L-520"><span class="linenos">520</span></a>                <span class="s1">&#39;class_relation&#39;</span><span class="p">:</span> <span class="n">class_relation</span><span class="p">,</span>
+</span><span id="L-521"><a href="#L-521"><span class="linenos">521</span></a>                <span class="s1">&#39;n_class&#39;</span><span class="p">:</span> <span class="n">n</span><span class="p">,</span>
+</span><span id="L-522"><a href="#L-522"><span class="linenos">522</span></a>            <span class="p">},</span>
+</span><span id="L-523"><a href="#L-523"><span class="linenos">523</span></a>        <span class="p">})</span>
+</span><span id="L-524"><a href="#L-524"><span class="linenos">524</span></a>
+</span><span id="L-525"><a href="#L-525"><span class="linenos">525</span></a>        <span class="k">return</span> <span class="n">y</span>
+</span><span id="L-526"><a href="#L-526"><span class="linenos">526</span></a>
+</span><span id="L-527"><a href="#L-527"><span class="linenos">527</span></a>    <span class="k">def</span> <span class="nf">_cluster_data</span><span class="p">(</span>
+</span><span id="L-528"><a href="#L-528"><span class="linenos">528</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-529"><a href="#L-529"><span class="linenos">529</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-530"><a href="#L-530"><span class="linenos">530</span></a>        <span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-531"><a href="#L-531"><span class="linenos">531</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">|</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mf">1.0</span><span class="p">,</span>
+</span><span id="L-532"><a href="#L-532"><span class="linenos">532</span></a>        <span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-533"><a href="#L-533"><span class="linenos">533</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-534"><a href="#L-534"><span class="linenos">534</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-535"><a href="#L-535"><span class="linenos">535</span></a><span class="sd">        Cluster data using kmeans</span>
+</span><span id="L-536"><a href="#L-536"><span class="linenos">536</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="L-537"><a href="#L-537"><span class="linenos">537</span></a><span class="sd">        :param n: number of clusters</span>
+</span><span id="L-538"><a href="#L-538"><span class="linenos">538</span></a><span class="sd">        :param p: class distribution</span>
+</span><span id="L-539"><a href="#L-539"><span class="linenos">539</span></a><span class="sd">        :param balance: balance the clusters according to p</span>
+</span><span id="L-540"><a href="#L-540"><span class="linenos">540</span></a><span class="sd">        :return: array of labels, corresponding to dataset X</span>
+</span><span id="L-541"><a href="#L-541"><span class="linenos">541</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-542"><a href="#L-542"><span class="linenos">542</span></a>
+</span><span id="L-543"><a href="#L-543"><span class="linenos">543</span></a>        <span class="n">kmeans</span> <span class="o">=</span> <span class="n">KMeans</span><span class="p">(</span><span class="n">n_clusters</span><span class="o">=</span><span class="n">n</span><span class="p">)</span>
+</span><span id="L-544"><a href="#L-544"><span class="linenos">544</span></a>
+</span><span id="L-545"><a href="#L-545"><span class="linenos">545</span></a>        <span class="n">kmeans</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="L-546"><a href="#L-546"><span class="linenos">546</span></a>
+</span><span id="L-547"><a href="#L-547"><span class="linenos">547</span></a>        <span class="n">cluster_labels</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">labels_</span>
+</span><span id="L-548"><a href="#L-548"><span class="linenos">548</span></a>
+</span><span id="L-549"><a href="#L-549"><span class="linenos">549</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>  <span class="c1"># Fully balanced clusters</span>
+</span><span id="L-550"><a href="#L-550"><span class="linenos">550</span></a>            <span class="n">samples_per_cluster</span> <span class="o">=</span> <span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">)</span> <span class="o">//</span> <span class="n">n</span><span class="p">]</span> <span class="o">*</span> <span class="n">n</span>
+</span><span id="L-551"><a href="#L-551"><span class="linenos">551</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-552"><a href="#L-552"><span class="linenos">552</span></a>            <span class="n">samples</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="L-553"><a href="#L-553"><span class="linenos">553</span></a>            <span class="n">samples_per_cluster</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-554"><a href="#L-554"><span class="linenos">554</span></a>            <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="L-555"><a href="#L-555"><span class="linenos">555</span></a>                <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span> <span class="o">//</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="L-556"><a href="#L-556"><span class="linenos">556</span></a>                <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="p">(</span><span class="mi">1</span> <span class="o">-</span> <span class="n">p</span><span class="p">))</span> <span class="o">//</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="L-557"><a href="#L-557"><span class="linenos">557</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="L-558"><a href="#L-558"><span class="linenos">558</span></a>                <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">==</span> <span class="n">n</span><span class="p">:</span>
+</span><span id="L-559"><a href="#L-559"><span class="linenos">559</span></a>                    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">p</span><span class="p">:</span>
+</span><span id="L-560"><a href="#L-560"><span class="linenos">560</span></a>                        <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="n">val</span><span class="p">))</span>
+</span><span id="L-561"><a href="#L-561"><span class="linenos">561</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="L-562"><a href="#L-562"><span class="linenos">562</span></a>                    <span class="k">raise</span> <span class="ne">Exception</span><span class="p">(</span><span class="s1">&#39;Length of balance parameter must equal number of clusters.&#39;</span><span class="p">)</span>
+</span><span id="L-563"><a href="#L-563"><span class="linenos">563</span></a>
+</span><span id="L-564"><a href="#L-564"><span class="linenos">564</span></a>        <span class="c1"># Adjust cluster sizes</span>
+</span><span id="L-565"><a href="#L-565"><span class="linenos">565</span></a>        <span class="k">if</span> <span class="n">balance</span><span class="p">:</span>
+</span><span id="L-566"><a href="#L-566"><span class="linenos">566</span></a>            <span class="n">adjustments</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-567"><a href="#L-567"><span class="linenos">567</span></a>            <span class="n">overflow_samples</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-568"><a href="#L-568"><span class="linenos">568</span></a>            <span class="n">overflow_indices</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-569"><a href="#L-569"><span class="linenos">569</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">):</span>
+</span><span id="L-570"><a href="#L-570"><span class="linenos">570</span></a>                <span class="n">cluster_size</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">cluster_labels</span> <span class="o">==</span> <span class="n">i</span><span class="p">)</span>
+</span><span id="L-571"><a href="#L-571"><span class="linenos">571</span></a>
+</span><span id="L-572"><a href="#L-572"><span class="linenos">572</span></a>                <span class="n">adjustment</span> <span class="o">=</span> <span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">-</span> <span class="n">cluster_size</span>
+</span><span id="L-573"><a href="#L-573"><span class="linenos">573</span></a>                <span class="n">adjustments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">adjustment</span><span class="p">)</span>
+</span><span id="L-574"><a href="#L-574"><span class="linenos">574</span></a>
+</span><span id="L-575"><a href="#L-575"><span class="linenos">575</span></a>                <span class="k">if</span> <span class="n">adjustment</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">:</span>  <span class="c1"># Cluter is too large</span>
+</span><span id="L-576"><a href="#L-576"><span class="linenos">576</span></a>
+</span><span id="L-577"><a href="#L-577"><span class="linenos">577</span></a>                    <span class="n">centroid</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">cluster_centers_</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="L-578"><a href="#L-578"><span class="linenos">578</span></a>                    <span class="n">dataset_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">cluster_labels</span> <span class="o">==</span> <span class="n">i</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>  <span class="c1"># Indices of samples in dataset</span>
+</span><span id="L-579"><a href="#L-579"><span class="linenos">579</span></a>                    <span class="n">cluster_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="n">dataset_indices</span><span class="p">])</span>
+</span><span id="L-580"><a href="#L-580"><span class="linenos">580</span></a>
+</span><span id="L-581"><a href="#L-581"><span class="linenos">581</span></a>                    <span class="n">distances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">linalg</span><span class="o">.</span><span class="n">norm</span><span class="p">(</span>
+</span><span id="L-582"><a href="#L-582"><span class="linenos">582</span></a>                        <span class="n">cluster_samples</span> <span class="o">-</span> <span class="n">centroid</span><span class="p">,</span>
+</span><span id="L-583"><a href="#L-583"><span class="linenos">583</span></a>                        <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="L-584"><a href="#L-584"><span class="linenos">584</span></a>                    <span class="p">)</span>  <span class="c1"># Distances of cluster samples to cluster centroid</span>
+</span><span id="L-585"><a href="#L-585"><span class="linenos">585</span></a>                    <span class="n">cluster_sample_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">distances</span><span class="p">)</span>
+</span><span id="L-586"><a href="#L-586"><span class="linenos">586</span></a>                    <span class="n">dataset_indices_sorted</span> <span class="o">=</span> <span class="n">dataset_indices</span><span class="p">[</span>
+</span><span id="L-587"><a href="#L-587"><span class="linenos">587</span></a>                        <span class="n">cluster_sample_indices</span>
+</span><span id="L-588"><a href="#L-588"><span class="linenos">588</span></a>                    <span class="p">]</span>  <span class="c1"># Indices of samples sorted by sample distance to cluster centroid</span>
+</span><span id="L-589"><a href="#L-589"><span class="linenos">589</span></a>
+</span><span id="L-590"><a href="#L-590"><span class="linenos">590</span></a>                    <span class="n">overflow_sample_indices</span> <span class="o">=</span> <span class="n">cluster_sample_indices</span><span class="p">[</span><span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]:]</span>  <span class="c1"># Overflow samples</span>
+</span><span id="L-591"><a href="#L-591"><span class="linenos">591</span></a>                    <span class="n">dataset_indices_sorted</span> <span class="o">=</span> <span class="n">dataset_indices_sorted</span><span class="p">[</span>
+</span><span id="L-592"><a href="#L-592"><span class="linenos">592</span></a>                                             <span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]:</span>
+</span><span id="L-593"><a href="#L-593"><span class="linenos">593</span></a>                    <span class="p">]</span>  <span class="c1"># Dataset indices of overflow samples</span>
+</span><span id="L-594"><a href="#L-594"><span class="linenos">594</span></a>
+</span><span id="L-595"><a href="#L-595"><span class="linenos">595</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">overflow_sample_indices</span><span class="p">)):</span>
+</span><span id="L-596"><a href="#L-596"><span class="linenos">596</span></a>                        <span class="n">overflow_samples</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster_samples</span><span class="p">[</span><span class="n">overflow_sample_indices</span><span class="p">[</span><span class="n">i</span><span class="p">]])</span>
+</span><span id="L-597"><a href="#L-597"><span class="linenos">597</span></a>                        <span class="n">overflow_indices</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">dataset_indices_sorted</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
+</span><span id="L-598"><a href="#L-598"><span class="linenos">598</span></a>
+</span><span id="L-599"><a href="#L-599"><span class="linenos">599</span></a>            <span class="n">overflow_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">overflow_samples</span><span class="p">)</span>
+</span><span id="L-600"><a href="#L-600"><span class="linenos">600</span></a>            <span class="n">overflow_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">overflow_indices</span><span class="p">)</span>
+</span><span id="L-601"><a href="#L-601"><span class="linenos">601</span></a>
+</span><span id="L-602"><a href="#L-602"><span class="linenos">602</span></a>            <span class="c1"># Making adjustments</span>
+</span><span id="L-603"><a href="#L-603"><span class="linenos">603</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">):</span>
+</span><span id="L-604"><a href="#L-604"><span class="linenos">604</span></a>
+</span><span id="L-605"><a href="#L-605"><span class="linenos">605</span></a>                <span class="k">if</span> <span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-606"><a href="#L-606"><span class="linenos">606</span></a>                    <span class="n">centroid</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">cluster_centers_</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="L-607"><a href="#L-607"><span class="linenos">607</span></a>                    <span class="n">distances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">linalg</span><span class="o">.</span><span class="n">norm</span><span class="p">(</span><span class="n">overflow_samples</span> <span class="o">-</span> <span class="n">centroid</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-608"><a href="#L-608"><span class="linenos">608</span></a>
+</span><span id="L-609"><a href="#L-609"><span class="linenos">609</span></a>                    <span class="n">closest_sample_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">distances</span><span class="p">)</span>
+</span><span id="L-610"><a href="#L-610"><span class="linenos">610</span></a>
+</span><span id="L-611"><a href="#L-611"><span class="linenos">611</span></a>                    <span class="n">overflow_indices_sorted</span> <span class="o">=</span> <span class="n">overflow_indices</span><span class="p">[</span><span class="n">closest_sample_indices</span><span class="p">]</span>
+</span><span id="L-612"><a href="#L-612"><span class="linenos">612</span></a>
+</span><span id="L-613"><a href="#L-613"><span class="linenos">613</span></a>                    <span class="n">sample_indices_slice</span> <span class="o">=</span> <span class="n">closest_sample_indices</span><span class="p">[:</span><span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span>
+</span><span id="L-614"><a href="#L-614"><span class="linenos">614</span></a>                    <span class="n">overflow_indices_slice</span> <span class="o">=</span> <span class="n">overflow_indices_sorted</span><span class="p">[:</span><span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span>
+</span><span id="L-615"><a href="#L-615"><span class="linenos">615</span></a>
+</span><span id="L-616"><a href="#L-616"><span class="linenos">616</span></a>                    <span class="n">cluster_labels</span><span class="p">[</span><span class="n">overflow_indices_slice</span><span class="p">]</span> <span class="o">=</span> <span class="n">i</span>
+</span><span id="L-617"><a href="#L-617"><span class="linenos">617</span></a>
+</span><span id="L-618"><a href="#L-618"><span class="linenos">618</span></a>                    <span class="n">overflow_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">delete</span><span class="p">(</span><span class="n">overflow_samples</span><span class="p">,</span> <span class="n">sample_indices_slice</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="L-619"><a href="#L-619"><span class="linenos">619</span></a>                    <span class="n">overflow_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">delete</span><span class="p">(</span><span class="n">overflow_indices</span><span class="p">,</span> <span class="n">sample_indices_slice</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="L-620"><a href="#L-620"><span class="linenos">620</span></a>
+</span><span id="L-621"><a href="#L-621"><span class="linenos">621</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">cluster_labels</span><span class="p">)</span>
+</span><span id="L-622"><a href="#L-622"><span class="linenos">622</span></a>
+</span><span id="L-623"><a href="#L-623"><span class="linenos">623</span></a>    <span class="k">def</span> <span class="nf">generate_noise</span><span class="p">(</span>
+</span><span id="L-624"><a href="#L-624"><span class="linenos">624</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-625"><a href="#L-625"><span class="linenos">625</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-626"><a href="#L-626"><span class="linenos">626</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-627"><a href="#L-627"><span class="linenos">627</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.2</span><span class="p">,</span>
+</span><span id="L-628"><a href="#L-628"><span class="linenos">628</span></a>        <span class="nb">type</span><span class="p">:</span> <span class="n">Literal</span> <span class="o">=</span> <span class="s1">&#39;categorical&#39;</span><span class="p">,</span>
+</span><span id="L-629"><a href="#L-629"><span class="linenos">629</span></a>        <span class="n">missing_val</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;-inf&#39;</span><span class="p">),</span>
+</span><span id="L-630"><a href="#L-630"><span class="linenos">630</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-631"><a href="#L-631"><span class="linenos">631</span></a>
+</span><span id="L-632"><a href="#L-632"><span class="linenos">632</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-633"><a href="#L-633"><span class="linenos">633</span></a><span class="sd">        Simulates noise on given dataset X</span>
+</span><span id="L-634"><a href="#L-634"><span class="linenos">634</span></a><span class="sd">        :param X: dataset to apply noise to</span>
+</span><span id="L-635"><a href="#L-635"><span class="linenos">635</span></a><span class="sd">        :param y: required target labels for categorical noise generation</span>
+</span><span id="L-636"><a href="#L-636"><span class="linenos">636</span></a><span class="sd">        :param p: amount of noise to apply. Defaults to 0.2</span>
+</span><span id="L-637"><a href="#L-637"><span class="linenos">637</span></a><span class="sd">        :param type: type of noise to apply, either categorical or missing</span>
+</span><span id="L-638"><a href="#L-638"><span class="linenos">638</span></a><span class="sd">        :param missing_val: value to simulate missing values. Defaults to float(&#39;-inf&#39;)</span>
+</span><span id="L-639"><a href="#L-639"><span class="linenos">639</span></a><span class="sd">        :return: X with noise applied</span>
+</span><span id="L-640"><a href="#L-640"><span class="linenos">640</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-641"><a href="#L-641"><span class="linenos">641</span></a>
+</span><span id="L-642"><a href="#L-642"><span class="linenos">642</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="L-643"><a href="#L-643"><span class="linenos">643</span></a>            <span class="s1">&#39;type&#39;</span><span class="p">:</span> <span class="nb">type</span><span class="p">,</span>
+</span><span id="L-644"><a href="#L-644"><span class="linenos">644</span></a>            <span class="s1">&#39;amount&#39;</span><span class="p">:</span> <span class="n">p</span><span class="p">,</span>
+</span><span id="L-645"><a href="#L-645"><span class="linenos">645</span></a>        <span class="p">})</span>
+</span><span id="L-646"><a href="#L-646"><span class="linenos">646</span></a>
+</span><span id="L-647"><a href="#L-647"><span class="linenos">647</span></a>        <span class="k">if</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;categorical&#39;</span><span class="p">:</span>
+</span><span id="L-648"><a href="#L-648"><span class="linenos">648</span></a>            <span class="n">label_values</span><span class="p">,</span> <span class="n">label_count</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="L-649"><a href="#L-649"><span class="linenos">649</span></a>            <span class="n">n_labels</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">label_values</span><span class="p">)</span>
+</span><span id="L-650"><a href="#L-650"><span class="linenos">650</span></a>
+</span><span id="L-651"><a href="#L-651"><span class="linenos">651</span></a>            <span class="n">inds</span> <span class="o">=</span> <span class="n">y</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
+</span><span id="L-652"><a href="#L-652"><span class="linenos">652</span></a>            <span class="n">y_sort</span> <span class="o">=</span> <span class="n">y</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
+</span><span id="L-653"><a href="#L-653"><span class="linenos">653</span></a>            <span class="n">X_sort</span> <span class="o">=</span> <span class="n">X</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
+</span><span id="L-654"><a href="#L-654"><span class="linenos">654</span></a>
+</span><span id="L-655"><a href="#L-655"><span class="linenos">655</span></a>            <span class="n">Xs_T</span> <span class="o">=</span> <span class="n">X_sort</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-656"><a href="#L-656"><span class="linenos">656</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="L-657"><a href="#L-657"><span class="linenos">657</span></a>            <span class="n">n_flip</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
+</span><span id="L-658"><a href="#L-658"><span class="linenos">658</span></a>
+</span><span id="L-659"><a href="#L-659"><span class="linenos">659</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xs_T</span><span class="p">:</span>
+</span><span id="L-660"><a href="#L-660"><span class="linenos">660</span></a>                <span class="n">unique_per_label</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-661"><a href="#L-661"><span class="linenos">661</span></a>
+</span><span id="L-662"><a href="#L-662"><span class="linenos">662</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_labels</span><span class="p">):</span>
+</span><span id="L-663"><a href="#L-663"><span class="linenos">663</span></a>                    <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-664"><a href="#L-664"><span class="linenos">664</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]])</span>
+</span><span id="L-665"><a href="#L-665"><span class="linenos">665</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
+</span><span id="L-666"><a href="#L-666"><span class="linenos">666</span></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="L-667"><a href="#L-667"><span class="linenos">667</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">-</span> <span class="mi">1</span><span class="p">])</span>
+</span><span id="L-668"><a href="#L-668"><span class="linenos">668</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
+</span><span id="L-669"><a href="#L-669"><span class="linenos">669</span></a>
+</span><span id="L-670"><a href="#L-670"><span class="linenos">670</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_flip</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="L-671"><a href="#L-671"><span class="linenos">671</span></a>
+</span><span id="L-672"><a href="#L-672"><span class="linenos">672</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
+</span><span id="L-673"><a href="#L-673"><span class="linenos">673</span></a>                    <span class="n">current_label</span> <span class="o">=</span> <span class="n">y_sort</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span>
+</span><span id="L-674"><a href="#L-674"><span class="linenos">674</span></a>                    <span class="n">possible_labels</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">label_values</span> <span class="o">!=</span> <span class="n">current_label</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="L-675"><a href="#L-675"><span class="linenos">675</span></a>
+</span><span id="L-676"><a href="#L-676"><span class="linenos">676</span></a>                    <span class="c1"># find all unique values from labels != current label</span>
+</span><span id="L-677"><a href="#L-677"><span class="linenos">677</span></a>                    <span class="n">values</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span>
+</span><span id="L-678"><a href="#L-678"><span class="linenos">678</span></a>                    <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">possible_labels</span><span class="p">:</span>
+</span><span id="L-679"><a href="#L-679"><span class="linenos">679</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">values</span><span class="o">.</span><span class="n">union</span><span class="p">(</span><span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">])</span>
+</span><span id="L-680"><a href="#L-680"><span class="linenos">680</span></a>
+</span><span id="L-681"><a href="#L-681"><span class="linenos">681</span></a>                    <span class="c1"># remove any overlapping values, ensuring replacement values are unique &amp; from a target label !=</span>
+</span><span id="L-682"><a href="#L-682"><span class="linenos">682</span></a>                    <span class="c1"># current label</span>
+</span><span id="L-683"><a href="#L-683"><span class="linenos">683</span></a>                    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">current_label</span><span class="p">]</span> <span class="o">&amp;</span> <span class="n">values</span><span class="p">:</span>
+</span><span id="L-684"><a href="#L-684"><span class="linenos">684</span></a>                        <span class="n">values</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">val</span><span class="p">)</span>
+</span><span id="L-685"><a href="#L-685"><span class="linenos">685</span></a>
+</span><span id="L-686"><a href="#L-686"><span class="linenos">686</span></a>                    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">values</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-687"><a href="#L-687"><span class="linenos">687</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
+</span><span id="L-688"><a href="#L-688"><span class="linenos">688</span></a>
+</span><span id="L-689"><a href="#L-689"><span class="linenos">689</span></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="L-690"><a href="#L-690"><span class="linenos">690</span></a>                        <span class="n">key</span> <span class="o">=</span> <span class="n">possible_labels</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">possible_labels</span><span class="p">))]</span>
+</span><span id="L-691"><a href="#L-691"><span class="linenos">691</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
+</span><span id="L-692"><a href="#L-692"><span class="linenos">692</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
+</span><span id="L-693"><a href="#L-693"><span class="linenos">693</span></a>
+</span><span id="L-694"><a href="#L-694"><span class="linenos">694</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">val</span>
+</span><span id="L-695"><a href="#L-695"><span class="linenos">695</span></a>
+</span><span id="L-696"><a href="#L-696"><span class="linenos">696</span></a>            <span class="n">rev_ind</span> <span class="o">=</span> <span class="n">inds</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
+</span><span id="L-697"><a href="#L-697"><span class="linenos">697</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-698"><a href="#L-698"><span class="linenos">698</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">X_noise</span><span class="p">[</span><span class="n">rev_ind</span><span class="p">]</span>
+</span><span id="L-699"><a href="#L-699"><span class="linenos">699</span></a>
+</span><span id="L-700"><a href="#L-700"><span class="linenos">700</span></a>            <span class="k">return</span> <span class="n">X_noise</span>
+</span><span id="L-701"><a href="#L-701"><span class="linenos">701</span></a>
+</span><span id="L-702"><a href="#L-702"><span class="linenos">702</span></a>        <span class="k">elif</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;missing&#39;</span><span class="p">:</span>
+</span><span id="L-703"><a href="#L-703"><span class="linenos">703</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="L-704"><a href="#L-704"><span class="linenos">704</span></a>            <span class="n">Xn_T</span> <span class="o">=</span> <span class="n">X_noise</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-705"><a href="#L-705"><span class="linenos">705</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="L-706"><a href="#L-706"><span class="linenos">706</span></a>            <span class="n">n_missing</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
+</span><span id="L-707"><a href="#L-707"><span class="linenos">707</span></a>            <span class="c1">#print(&quot;n to delete:&quot;, n_missing)</span>
+</span><span id="L-708"><a href="#L-708"><span class="linenos">708</span></a>
+</span><span id="L-709"><a href="#L-709"><span class="linenos">709</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xn_T</span><span class="p">:</span>
+</span><span id="L-710"><a href="#L-710"><span class="linenos">710</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_missing</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="L-711"><a href="#L-711"><span class="linenos">711</span></a>
+</span><span id="L-712"><a href="#L-712"><span class="linenos">712</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
+</span><span id="L-713"><a href="#L-713"><span class="linenos">713</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">missing_val</span>
+</span><span id="L-714"><a href="#L-714"><span class="linenos">714</span></a>
+</span><span id="L-715"><a href="#L-715"><span class="linenos">715</span></a>            <span class="k">return</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-716"><a href="#L-716"><span class="linenos">716</span></a>
+</span><span id="L-717"><a href="#L-717"><span class="linenos">717</span></a>    <span class="k">def</span> <span class="nf">downsample_dataset</span><span class="p">(</span>
+</span><span id="L-718"><a href="#L-718"><span class="linenos">718</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-719"><a href="#L-719"><span class="linenos">719</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-720"><a href="#L-720"><span class="linenos">720</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-721"><a href="#L-721"><span class="linenos">721</span></a>        <span class="n">N</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-722"><a href="#L-722"><span class="linenos">722</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
+</span><span id="L-723"><a href="#L-723"><span class="linenos">723</span></a>        <span class="n">reshuffle</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-724"><a href="#L-724"><span class="linenos">724</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">]:</span>
+</span><span id="L-725"><a href="#L-725"><span class="linenos">725</span></a>
+</span><span id="L-726"><a href="#L-726"><span class="linenos">726</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-727"><a href="#L-727"><span class="linenos">727</span></a><span class="sd">        Downsamples dataset X according to N or the number of samples in minority class, resulting in a balanced dataset.</span>
+</span><span id="L-728"><a href="#L-728"><span class="linenos">728</span></a><span class="sd">        :param X: Dataset to downsample</span>
+</span><span id="L-729"><a href="#L-729"><span class="linenos">729</span></a><span class="sd">        :param y: Labels corresponding to X</span>
+</span><span id="L-730"><a href="#L-730"><span class="linenos">730</span></a><span class="sd">        :param N: Optional number of samples per class to downsample to</span>
+</span><span id="L-731"><a href="#L-731"><span class="linenos">731</span></a><span class="sd">        :param seed: Seed for random state of resample function</span>
+</span><span id="L-732"><a href="#L-732"><span class="linenos">732</span></a><span class="sd">        :param reshuffle: Reshuffle the dataset after downsampling</span>
+</span><span id="L-733"><a href="#L-733"><span class="linenos">733</span></a><span class="sd">        :return: Balanced X and y after downsampling</span>
+</span><span id="L-734"><a href="#L-734"><span class="linenos">734</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-735"><a href="#L-735"><span class="linenos">735</span></a>
+</span><span id="L-736"><a href="#L-736"><span class="linenos">736</span></a>        <span class="n">original_shape</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="L-737"><a href="#L-737"><span class="linenos">737</span></a>
+</span><span id="L-738"><a href="#L-738"><span class="linenos">738</span></a>        <span class="n">values</span><span class="p">,</span> <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="L-739"><a href="#L-739"><span class="linenos">739</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-740"><a href="#L-740"><span class="linenos">740</span></a>            <span class="n">N</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">)</span>
+</span><span id="L-741"><a href="#L-741"><span class="linenos">741</span></a>
+</span><span id="L-742"><a href="#L-742"><span class="linenos">742</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="o">&gt;</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">):</span>
+</span><span id="L-743"><a href="#L-743"><span class="linenos">743</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;N must be equal to or less than the number of samples in minority class&#39;</span><span class="p">)</span>
+</span><span id="L-744"><a href="#L-744"><span class="linenos">744</span></a>
+</span><span id="L-745"><a href="#L-745"><span class="linenos">745</span></a>        <span class="n">X_arrays_list</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-746"><a href="#L-746"><span class="linenos">746</span></a>        <span class="n">y_downsampled</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-747"><a href="#L-747"><span class="linenos">747</span></a>        <span class="k">for</span> <span class="n">label</span> <span class="ow">in</span> <span class="n">values</span><span class="p">:</span>
+</span><span id="L-748"><a href="#L-748"><span class="linenos">748</span></a>            <span class="n">X_label</span> <span class="o">=</span> <span class="p">[</span><span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">y</span><span class="p">))</span> <span class="k">if</span> <span class="n">y</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">==</span> <span class="n">label</span><span class="p">]</span>
+</span><span id="L-749"><a href="#L-749"><span class="linenos">749</span></a>            <span class="n">X_label_downsample</span> <span class="o">=</span> <span class="n">resample</span><span class="p">(</span>
+</span><span id="L-750"><a href="#L-750"><span class="linenos">750</span></a>                <span class="n">X_label</span><span class="p">,</span>
+</span><span id="L-751"><a href="#L-751"><span class="linenos">751</span></a>                <span class="n">replace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+</span><span id="L-752"><a href="#L-752"><span class="linenos">752</span></a>                <span class="n">n_samples</span><span class="o">=</span><span class="n">N</span><span class="p">,</span>
+</span><span id="L-753"><a href="#L-753"><span class="linenos">753</span></a>                <span class="n">random_state</span><span class="o">=</span><span class="n">seed</span><span class="p">,</span>
+</span><span id="L-754"><a href="#L-754"><span class="linenos">754</span></a>            <span class="p">)</span>
+</span><span id="L-755"><a href="#L-755"><span class="linenos">755</span></a>            <span class="n">X_arrays_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">X_label_downsample</span><span class="p">)</span>
+</span><span id="L-756"><a href="#L-756"><span class="linenos">756</span></a>            <span class="n">ys</span> <span class="o">=</span> <span class="p">[</span><span class="n">label</span><span class="p">]</span> <span class="o">*</span> <span class="n">N</span>
+</span><span id="L-757"><a href="#L-757"><span class="linenos">757</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">y_downsampled</span><span class="p">,</span> <span class="n">ys</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="L-758"><a href="#L-758"><span class="linenos">758</span></a>
+</span><span id="L-759"><a href="#L-759"><span class="linenos">759</span></a>        <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">X_arrays_list</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="L-760"><a href="#L-760"><span class="linenos">760</span></a>
+</span><span id="L-761"><a href="#L-761"><span class="linenos">761</span></a>        <span class="k">if</span> <span class="n">reshuffle</span><span class="p">:</span>
+</span><span id="L-762"><a href="#L-762"><span class="linenos">762</span></a>            <span class="n">indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X_downsampled</span><span class="p">))</span>
+</span><span id="L-763"><a href="#L-763"><span class="linenos">763</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">indices</span><span class="p">)</span>
+</span><span id="L-764"><a href="#L-764"><span class="linenos">764</span></a>            <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
+</span><span id="L-765"><a href="#L-765"><span class="linenos">765</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">y_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
+</span><span id="L-766"><a href="#L-766"><span class="linenos">766</span></a>
+</span><span id="L-767"><a href="#L-767"><span class="linenos">767</span></a>        <span class="n">downsampled_shape</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="L-768"><a href="#L-768"><span class="linenos">768</span></a>
+</span><span id="L-769"><a href="#L-769"><span class="linenos">769</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="L-770"><a href="#L-770"><span class="linenos">770</span></a>            <span class="s1">&#39;downsampling&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="L-771"><a href="#L-771"><span class="linenos">771</span></a>                <span class="s1">&#39;original_shape&#39;</span><span class="p">:</span> <span class="n">original_shape</span><span class="p">,</span>
+</span><span id="L-772"><a href="#L-772"><span class="linenos">772</span></a>                <span class="s1">&#39;downsampled_shape&#39;</span><span class="p">:</span> <span class="n">downsampled_shape</span><span class="p">,</span>
+</span><span id="L-773"><a href="#L-773"><span class="linenos">773</span></a>            <span class="p">},</span>
+</span><span id="L-774"><a href="#L-774"><span class="linenos">774</span></a>        <span class="p">})</span>
+</span><span id="L-775"><a href="#L-775"><span class="linenos">775</span></a>
+</span><span id="L-776"><a href="#L-776"><span class="linenos">776</span></a>        <span class="k">return</span> <span class="n">X_downsampled</span><span class="p">,</span> <span class="n">y_downsampled</span>
+</span><span id="L-777"><a href="#L-777"><span class="linenos">777</span></a>
+</span><span id="L-778"><a href="#L-778"><span class="linenos">778</span></a>    <span class="k">def</span> <span class="nf">print_dataset</span><span class="p">(</span>
+</span><span id="L-779"><a href="#L-779"><span class="linenos">779</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-780"><a href="#L-780"><span class="linenos">780</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-781"><a href="#L-781"><span class="linenos">781</span></a>        <span class="n">y</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-782"><a href="#L-782"><span class="linenos">782</span></a>    <span class="p">):</span>
+</span><span id="L-783"><a href="#L-783"><span class="linenos">783</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-784"><a href="#L-784"><span class="linenos">784</span></a><span class="sd">        Prints given dataset</span>
+</span><span id="L-785"><a href="#L-785"><span class="linenos">785</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="L-786"><a href="#L-786"><span class="linenos">786</span></a><span class="sd">        :param y: labels</span>
+</span><span id="L-787"><a href="#L-787"><span class="linenos">787</span></a><span class="sd">        :return:</span>
+</span><span id="L-788"><a href="#L-788"><span class="linenos">788</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-789"><a href="#L-789"><span class="linenos">789</span></a>
+</span><span id="L-790"><a href="#L-790"><span class="linenos">790</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="L-791"><a href="#L-791"><span class="linenos">791</span></a>        <span class="n">n</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-792"><a href="#L-792"><span class="linenos">792</span></a>        <span class="k">for</span> <span class="n">arr</span> <span class="ow">in</span> <span class="n">X</span><span class="p">:</span>
+</span><span id="L-793"><a href="#L-793"><span class="linenos">793</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;[&#39;</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
+</span><span id="L-794"><a href="#L-794"><span class="linenos">794</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
+</span><span id="L-795"><a href="#L-795"><span class="linenos">795</span></a>                <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="n">n_features</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="L-796"><a href="#L-796"><span class="linenos">796</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
+</span><span id="L-797"><a href="#L-797"><span class="linenos">797</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="L-798"><a href="#L-798"><span class="linenos">798</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;, &#39;</span><span class="p">)</span>
+</span><span id="L-799"><a href="#L-799"><span class="linenos">799</span></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;], Label: </span><span class="si">{</span><span class="n">y</span><span class="p">[</span><span class="n">n</span><span class="p">]</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="L-800"><a href="#L-800"><span class="linenos">800</span></a>            <span class="n">n</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-801"><a href="#L-801"><span class="linenos">801</span></a>
+</span><span id="L-802"><a href="#L-802"><span class="linenos">802</span></a>    <span class="k">def</span> <span class="nf">summarize</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="L-803"><a href="#L-803"><span class="linenos">803</span></a>
+</span><span id="L-804"><a href="#L-804"><span class="linenos">804</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of features: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;general&#39;</span><span class="p">][</span><span class="s1">&#39;n_features&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="L-805"><a href="#L-805"><span class="linenos">805</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of generated samples: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;general&#39;</span><span class="p">][</span><span class="s1">&#39;n_samples&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="L-806"><a href="#L-806"><span class="linenos">806</span></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">]:</span>
+</span><span id="L-807"><a href="#L-807"><span class="linenos">807</span></a>            <span class="nb">print</span><span class="p">(</span>
+</span><span id="L-808"><a href="#L-808"><span class="linenos">808</span></a>                <span class="sa">f</span><span class="s2">&quot;Dataset downsampled from shape </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">][</span><span class="s1">&#39;original_shape&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">, to shape </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">][</span><span class="s1">&#39;downsampled_shape&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="L-809"><a href="#L-809"><span class="linenos">809</span></a>            <span class="p">)</span>
+</span><span id="L-810"><a href="#L-810"><span class="linenos">810</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of classes: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;labels&#39;</span><span class="p">][</span><span class="s1">&#39;n_class&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="L-811"><a href="#L-811"><span class="linenos">811</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Class relation: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;labels&#39;</span><span class="p">][</span><span class="s1">&#39;class_relation&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="L-812"><a href="#L-812"><span class="linenos">812</span></a>
+</span><span id="L-813"><a href="#L-813"><span class="linenos">813</span></a>        <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
+</span><span id="L-814"><a href="#L-814"><span class="linenos">814</span></a>
+</span><span id="L-815"><a href="#L-815"><span class="linenos">815</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-816"><a href="#L-816"><span class="linenos">816</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Combinations:&#39;</span><span class="p">)</span>
+</span><span id="L-817"><a href="#L-817"><span class="linenos">817</span></a>            <span class="k">for</span> <span class="n">comb</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">]:</span>
+</span><span id="L-818"><a href="#L-818"><span class="linenos">818</span></a>                <span class="nb">print</span><span class="p">(</span>
+</span><span id="L-819"><a href="#L-819"><span class="linenos">819</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are in </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;combination_type&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> combination, result in </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;combination_ix&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="L-820"><a href="#L-820"><span class="linenos">820</span></a>                <span class="p">)</span>
+</span><span id="L-821"><a href="#L-821"><span class="linenos">821</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
+</span><span id="L-822"><a href="#L-822"><span class="linenos">822</span></a>
+</span><span id="L-823"><a href="#L-823"><span class="linenos">823</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-824"><a href="#L-824"><span class="linenos">824</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Correlations:&#39;</span><span class="p">)</span>
+</span><span id="L-825"><a href="#L-825"><span class="linenos">825</span></a>            <span class="k">for</span> <span class="n">corr</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">]:</span>
+</span><span id="L-826"><a href="#L-826"><span class="linenos">826</span></a>                <span class="nb">print</span><span class="p">(</span>
+</span><span id="L-827"><a href="#L-827"><span class="linenos">827</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are correlated to </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;correlated_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> with a factor of </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;correlation_factor&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="L-828"><a href="#L-828"><span class="linenos">828</span></a>                <span class="p">)</span>
+</span><span id="L-829"><a href="#L-829"><span class="linenos">829</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
+</span><span id="L-830"><a href="#L-830"><span class="linenos">830</span></a>
+</span><span id="L-831"><a href="#L-831"><span class="linenos">831</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-832"><a href="#L-832"><span class="linenos">832</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Duplicates:&#39;</span><span class="p">)</span>
+</span><span id="L-833"><a href="#L-833"><span class="linenos">833</span></a>            <span class="k">for</span> <span class="n">dup</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">]:</span>
+</span><span id="L-834"><a href="#L-834"><span class="linenos">834</span></a>                <span class="nb">print</span><span class="p">(</span>
+</span><span id="L-835"><a href="#L-835"><span class="linenos">835</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">dup</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are duplicated, duplicate indexes are </span><span class="si">{</span><span class="n">dup</span><span class="p">[</span><span class="s1">&#39;duplicate_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="L-836"><a href="#L-836"><span class="linenos">836</span></a>                <span class="p">)</span>
+</span><span id="L-837"><a href="#L-837"><span class="linenos">837</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
+</span><span id="L-838"><a href="#L-838"><span class="linenos">838</span></a>
+</span><span id="L-839"><a href="#L-839"><span class="linenos">839</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-840"><a href="#L-840"><span class="linenos">840</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Simulated noise:&#39;</span><span class="p">)</span>
+</span><span id="L-841"><a href="#L-841"><span class="linenos">841</span></a>            <span class="k">for</span> <span class="n">noise</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">]:</span>
+</span><span id="L-842"><a href="#L-842"><span class="linenos">842</span></a>                <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Simulated </span><span class="si">{</span><span class="n">noise</span><span class="p">[</span><span class="s1">&#39;type&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> noise, amount of </span><span class="si">{</span><span class="n">noise</span><span class="p">[</span><span class="s1">&#39;noise_amount&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="L-843"><a href="#L-843"><span class="linenos">843</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
+</span><span id="L-844"><a href="#L-844"><span class="linenos">844</span></a>
+</span><span id="L-845"><a href="#L-845"><span class="linenos">845</span></a>        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\n</span><span class="s2">For more information on dataset structure, print cc.dataset_info[&#39;general&#39;][&#39;structure&#39;]&quot;</span><span class="p">)</span>
+</span></pre></div>
+
+
+            </section>
+                <section id="CategoricalClassification">
+                            <input id="CategoricalClassification-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">CategoricalClassification</span>:
+
+                <label class="view-source-button" for="CategoricalClassification-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#CategoricalClassification"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification-18"><a href="#CategoricalClassification-18"><span class="linenos"> 18</span></a><span class="k">class</span> <span class="nc">CategoricalClassification</span><span class="p">:</span>
+</span><span id="CategoricalClassification-19"><a href="#CategoricalClassification-19"><span class="linenos"> 19</span></a>
+</span><span id="CategoricalClassification-20"><a href="#CategoricalClassification-20"><span class="linenos"> 20</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="CategoricalClassification-21"><a href="#CategoricalClassification-21"><span class="linenos"> 21</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="CategoricalClassification-22"><a href="#CategoricalClassification-22"><span class="linenos"> 22</span></a>            <span class="s1">&#39;general&#39;</span><span class="p">:</span> <span class="p">{},</span>
+</span><span id="CategoricalClassification-23"><a href="#CategoricalClassification-23"><span class="linenos"> 23</span></a>            <span class="s1">&#39;combinations&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="CategoricalClassification-24"><a href="#CategoricalClassification-24"><span class="linenos"> 24</span></a>            <span class="s1">&#39;correlations&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="CategoricalClassification-25"><a href="#CategoricalClassification-25"><span class="linenos"> 25</span></a>            <span class="s1">&#39;duplicates&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="CategoricalClassification-26"><a href="#CategoricalClassification-26"><span class="linenos"> 26</span></a>            <span class="s1">&#39;labels&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="CategoricalClassification-27"><a href="#CategoricalClassification-27"><span class="linenos"> 27</span></a>            <span class="s1">&#39;noise&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="CategoricalClassification-28"><a href="#CategoricalClassification-28"><span class="linenos"> 28</span></a>        <span class="p">}</span>
+</span><span id="CategoricalClassification-29"><a href="#CategoricalClassification-29"><span class="linenos"> 29</span></a>
+</span><span id="CategoricalClassification-30"><a href="#CategoricalClassification-30"><span class="linenos"> 30</span></a>    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="CategoricalClassification-31"><a href="#CategoricalClassification-31"><span class="linenos"> 31</span></a>        <span class="k">return</span> <span class="sa">f</span><span class="s2">&quot;CategoricalClassification(dataset_info=</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="si">}</span><span class="s2">)&quot;</span>
+</span><span id="CategoricalClassification-32"><a href="#CategoricalClassification-32"><span class="linenos"> 32</span></a>
+</span><span id="CategoricalClassification-33"><a href="#CategoricalClassification-33"><span class="linenos"> 33</span></a>    <span class="k">def</span> <span class="nf">generate_data</span><span class="p">(</span>
+</span><span id="CategoricalClassification-34"><a href="#CategoricalClassification-34"><span class="linenos"> 34</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-35"><a href="#CategoricalClassification-35"><span class="linenos"> 35</span></a>        <span class="n">n_features</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="CategoricalClassification-36"><a href="#CategoricalClassification-36"><span class="linenos"> 36</span></a>        <span class="n">n_samples</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="CategoricalClassification-37"><a href="#CategoricalClassification-37"><span class="linenos"> 37</span></a>        <span class="n">cardinality</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
+</span><span id="CategoricalClassification-38"><a href="#CategoricalClassification-38"><span class="linenos"> 38</span></a>        <span class="n">structure</span><span class="p">:</span> <span class="nb">list</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification-39"><a href="#CategoricalClassification-39"><span class="linenos"> 39</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-40"><a href="#CategoricalClassification-40"><span class="linenos"> 40</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-41"><a href="#CategoricalClassification-41"><span class="linenos"> 41</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
+</span><span id="CategoricalClassification-42"><a href="#CategoricalClassification-42"><span class="linenos"> 42</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
+</span><span id="CategoricalClassification-43"><a href="#CategoricalClassification-43"><span class="linenos"> 43</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
+</span><span id="CategoricalClassification-44"><a href="#CategoricalClassification-44"><span class="linenos"> 44</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-45"><a href="#CategoricalClassification-45"><span class="linenos"> 45</span></a>
+</span><span id="CategoricalClassification-46"><a href="#CategoricalClassification-46"><span class="linenos"> 46</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-47"><a href="#CategoricalClassification-47"><span class="linenos"> 47</span></a><span class="sd">        Generates dataset based on given parameters</span>
+</span><span id="CategoricalClassification-48"><a href="#CategoricalClassification-48"><span class="linenos"> 48</span></a><span class="sd">        :param n_features: number of generated features</span>
+</span><span id="CategoricalClassification-49"><a href="#CategoricalClassification-49"><span class="linenos"> 49</span></a><span class="sd">        :param n_samples: number of generated samples</span>
+</span><span id="CategoricalClassification-50"><a href="#CategoricalClassification-50"><span class="linenos"> 50</span></a><span class="sd">        :param cardinality: default cardinality of the dataset</span>
+</span><span id="CategoricalClassification-51"><a href="#CategoricalClassification-51"><span class="linenos"> 51</span></a><span class="sd">        :param structure: structure of the dataset</span>
+</span><span id="CategoricalClassification-52"><a href="#CategoricalClassification-52"><span class="linenos"> 52</span></a><span class="sd">        :param ensure_rep: flag, ensures all given values represented</span>
+</span><span id="CategoricalClassification-53"><a href="#CategoricalClassification-53"><span class="linenos"> 53</span></a><span class="sd">        :param random_values: flag, enables random (integer) feature values from set [low, high]</span>
+</span><span id="CategoricalClassification-54"><a href="#CategoricalClassification-54"><span class="linenos"> 54</span></a><span class="sd">        :param low: sets lower bound of random feature values</span>
+</span><span id="CategoricalClassification-55"><a href="#CategoricalClassification-55"><span class="linenos"> 55</span></a><span class="sd">        :param high: sets high bound of random feature values</span>
+</span><span id="CategoricalClassification-56"><a href="#CategoricalClassification-56"><span class="linenos"> 56</span></a><span class="sd">        :param seed: sets seed of numpy random</span>
+</span><span id="CategoricalClassification-57"><a href="#CategoricalClassification-57"><span class="linenos"> 57</span></a><span class="sd">        :return: X, 2D dataset</span>
+</span><span id="CategoricalClassification-58"><a href="#CategoricalClassification-58"><span class="linenos"> 58</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-59"><a href="#CategoricalClassification-59"><span class="linenos"> 59</span></a>
+</span><span id="CategoricalClassification-60"><a href="#CategoricalClassification-60"><span class="linenos"> 60</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="CategoricalClassification-61"><a href="#CategoricalClassification-61"><span class="linenos"> 61</span></a>            <span class="s1">&#39;general&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="CategoricalClassification-62"><a href="#CategoricalClassification-62"><span class="linenos"> 62</span></a>                <span class="s1">&#39;n_features&#39;</span><span class="p">:</span> <span class="n">n_features</span><span class="p">,</span>
+</span><span id="CategoricalClassification-63"><a href="#CategoricalClassification-63"><span class="linenos"> 63</span></a>                <span class="s1">&#39;n_samples&#39;</span><span class="p">:</span> <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-64"><a href="#CategoricalClassification-64"><span class="linenos"> 64</span></a>                <span class="s1">&#39;cardinality&#39;</span><span class="p">:</span> <span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification-65"><a href="#CategoricalClassification-65"><span class="linenos"> 65</span></a>                <span class="s1">&#39;structure&#39;</span><span class="p">:</span> <span class="n">structure</span><span class="p">,</span>
+</span><span id="CategoricalClassification-66"><a href="#CategoricalClassification-66"><span class="linenos"> 66</span></a>                <span class="s1">&#39;ensure_rep&#39;</span><span class="p">:</span> <span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-67"><a href="#CategoricalClassification-67"><span class="linenos"> 67</span></a>                <span class="s1">&#39;seed&#39;</span><span class="p">:</span> <span class="n">seed</span><span class="p">,</span>
+</span><span id="CategoricalClassification-68"><a href="#CategoricalClassification-68"><span class="linenos"> 68</span></a>            <span class="p">},</span>
+</span><span id="CategoricalClassification-69"><a href="#CategoricalClassification-69"><span class="linenos"> 69</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification-70"><a href="#CategoricalClassification-70"><span class="linenos"> 70</span></a>
+</span><span id="CategoricalClassification-71"><a href="#CategoricalClassification-71"><span class="linenos"> 71</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">seed</span><span class="p">(</span><span class="n">seed</span><span class="p">)</span>
+</span><span id="CategoricalClassification-72"><a href="#CategoricalClassification-72"><span class="linenos"> 72</span></a>        <span class="n">X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">empty</span><span class="p">([</span><span class="n">n_features</span><span class="p">,</span> <span class="n">n_samples</span><span class="p">])</span>
+</span><span id="CategoricalClassification-73"><a href="#CategoricalClassification-73"><span class="linenos"> 73</span></a>
+</span><span id="CategoricalClassification-74"><a href="#CategoricalClassification-74"><span class="linenos"> 74</span></a>        <span class="k">if</span> <span class="n">structure</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification-75"><a href="#CategoricalClassification-75"><span class="linenos"> 75</span></a>            <span class="c1"># No specific structure parameter passed</span>
+</span><span id="CategoricalClassification-76"><a href="#CategoricalClassification-76"><span class="linenos"> 76</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
+</span><span id="CategoricalClassification-77"><a href="#CategoricalClassification-77"><span class="linenos"> 77</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-78"><a href="#CategoricalClassification-78"><span class="linenos"> 78</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-79"><a href="#CategoricalClassification-79"><span class="linenos"> 79</span></a>                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification-80"><a href="#CategoricalClassification-80"><span class="linenos"> 80</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-81"><a href="#CategoricalClassification-81"><span class="linenos"> 81</span></a>                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification-82"><a href="#CategoricalClassification-82"><span class="linenos"> 82</span></a>                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification-83"><a href="#CategoricalClassification-83"><span class="linenos"> 83</span></a>                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification-84"><a href="#CategoricalClassification-84"><span class="linenos"> 84</span></a>                <span class="p">)</span>
+</span><span id="CategoricalClassification-85"><a href="#CategoricalClassification-85"><span class="linenos"> 85</span></a>                <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification-86"><a href="#CategoricalClassification-86"><span class="linenos"> 86</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-87"><a href="#CategoricalClassification-87"><span class="linenos"> 87</span></a>            <span class="c1"># Structure parameter passed, building based on structure</span>
+</span><span id="CategoricalClassification-88"><a href="#CategoricalClassification-88"><span class="linenos"> 88</span></a>            <span class="n">ix</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="CategoricalClassification-89"><a href="#CategoricalClassification-89"><span class="linenos"> 89</span></a>            <span class="k">for</span> <span class="n">data</span> <span class="ow">in</span> <span class="n">structure</span><span class="p">:</span>
+</span><span id="CategoricalClassification-90"><a href="#CategoricalClassification-90"><span class="linenos"> 90</span></a>                <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">data</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-91"><a href="#CategoricalClassification-91"><span class="linenos"> 91</span></a>                    <span class="c1"># Data in structure is a tuple of (feature index (integer), feature attributes)</span>
+</span><span id="CategoricalClassification-92"><a href="#CategoricalClassification-92"><span class="linenos"> 92</span></a>                    <span class="n">feature_ix</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
+</span><span id="CategoricalClassification-93"><a href="#CategoricalClassification-93"><span class="linenos"> 93</span></a>
+</span><span id="CategoricalClassification-94"><a href="#CategoricalClassification-94"><span class="linenos"> 94</span></a>                    <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
+</span><span id="CategoricalClassification-95"><a href="#CategoricalClassification-95"><span class="linenos"> 95</span></a>                        <span class="c1"># Filling out the dataset up to column index feature_ix</span>
+</span><span id="CategoricalClassification-96"><a href="#CategoricalClassification-96"><span class="linenos"> 96</span></a>                        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
+</span><span id="CategoricalClassification-97"><a href="#CategoricalClassification-97"><span class="linenos"> 97</span></a>                            <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-98"><a href="#CategoricalClassification-98"><span class="linenos"> 98</span></a>                                <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-99"><a href="#CategoricalClassification-99"><span class="linenos"> 99</span></a>                                <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification-100"><a href="#CategoricalClassification-100"><span class="linenos">100</span></a>                                <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-101"><a href="#CategoricalClassification-101"><span class="linenos">101</span></a>                                <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification-102"><a href="#CategoricalClassification-102"><span class="linenos">102</span></a>                                <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification-103"><a href="#CategoricalClassification-103"><span class="linenos">103</span></a>                                <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification-104"><a href="#CategoricalClassification-104"><span class="linenos">104</span></a>                            <span class="p">)</span>
+</span><span id="CategoricalClassification-105"><a href="#CategoricalClassification-105"><span class="linenos">105</span></a>                            <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification-106"><a href="#CategoricalClassification-106"><span class="linenos">106</span></a>                            <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification-107"><a href="#CategoricalClassification-107"><span class="linenos">107</span></a>
+</span><span id="CategoricalClassification-108"><a href="#CategoricalClassification-108"><span class="linenos">108</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-109"><a href="#CategoricalClassification-109"><span class="linenos">109</span></a>                        <span class="n">feature_attributes</span><span class="p">,</span>
+</span><span id="CategoricalClassification-110"><a href="#CategoricalClassification-110"><span class="linenos">110</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-111"><a href="#CategoricalClassification-111"><span class="linenos">111</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-112"><a href="#CategoricalClassification-112"><span class="linenos">112</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification-113"><a href="#CategoricalClassification-113"><span class="linenos">113</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification-114"><a href="#CategoricalClassification-114"><span class="linenos">114</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification-115"><a href="#CategoricalClassification-115"><span class="linenos">115</span></a>                    <span class="p">)</span>
+</span><span id="CategoricalClassification-116"><a href="#CategoricalClassification-116"><span class="linenos">116</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification-117"><a href="#CategoricalClassification-117"><span class="linenos">117</span></a>                    <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification-118"><a href="#CategoricalClassification-118"><span class="linenos">118</span></a>
+</span><span id="CategoricalClassification-119"><a href="#CategoricalClassification-119"><span class="linenos">119</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-120"><a href="#CategoricalClassification-120"><span class="linenos">120</span></a>                    <span class="c1"># Data in structure is a tuple of (list of feature indexes, feature attributes)</span>
+</span><span id="CategoricalClassification-121"><a href="#CategoricalClassification-121"><span class="linenos">121</span></a>                    <span class="n">feature_ixs</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
+</span><span id="CategoricalClassification-122"><a href="#CategoricalClassification-122"><span class="linenos">122</span></a>
+</span><span id="CategoricalClassification-123"><a href="#CategoricalClassification-123"><span class="linenos">123</span></a>                    <span class="k">for</span> <span class="n">feature_ix</span> <span class="ow">in</span> <span class="n">feature_ixs</span><span class="p">:</span>
+</span><span id="CategoricalClassification-124"><a href="#CategoricalClassification-124"><span class="linenos">124</span></a>                        <span class="c1"># Filling out the dataset up to feature_ix</span>
+</span><span id="CategoricalClassification-125"><a href="#CategoricalClassification-125"><span class="linenos">125</span></a>                        <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
+</span><span id="CategoricalClassification-126"><a href="#CategoricalClassification-126"><span class="linenos">126</span></a>                            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
+</span><span id="CategoricalClassification-127"><a href="#CategoricalClassification-127"><span class="linenos">127</span></a>                                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-128"><a href="#CategoricalClassification-128"><span class="linenos">128</span></a>                                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-129"><a href="#CategoricalClassification-129"><span class="linenos">129</span></a>                                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification-130"><a href="#CategoricalClassification-130"><span class="linenos">130</span></a>                                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-131"><a href="#CategoricalClassification-131"><span class="linenos">131</span></a>                                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification-132"><a href="#CategoricalClassification-132"><span class="linenos">132</span></a>                                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification-133"><a href="#CategoricalClassification-133"><span class="linenos">133</span></a>                                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification-134"><a href="#CategoricalClassification-134"><span class="linenos">134</span></a>                                <span class="p">)</span>
+</span><span id="CategoricalClassification-135"><a href="#CategoricalClassification-135"><span class="linenos">135</span></a>                                <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification-136"><a href="#CategoricalClassification-136"><span class="linenos">136</span></a>                                <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification-137"><a href="#CategoricalClassification-137"><span class="linenos">137</span></a>
+</span><span id="CategoricalClassification-138"><a href="#CategoricalClassification-138"><span class="linenos">138</span></a>                        <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-139"><a href="#CategoricalClassification-139"><span class="linenos">139</span></a>                            <span class="n">feature_attributes</span><span class="p">,</span>
+</span><span id="CategoricalClassification-140"><a href="#CategoricalClassification-140"><span class="linenos">140</span></a>                            <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-141"><a href="#CategoricalClassification-141"><span class="linenos">141</span></a>                            <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-142"><a href="#CategoricalClassification-142"><span class="linenos">142</span></a>                            <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification-143"><a href="#CategoricalClassification-143"><span class="linenos">143</span></a>                            <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification-144"><a href="#CategoricalClassification-144"><span class="linenos">144</span></a>                            <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification-145"><a href="#CategoricalClassification-145"><span class="linenos">145</span></a>                        <span class="p">)</span>
+</span><span id="CategoricalClassification-146"><a href="#CategoricalClassification-146"><span class="linenos">146</span></a>
+</span><span id="CategoricalClassification-147"><a href="#CategoricalClassification-147"><span class="linenos">147</span></a>                        <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification-148"><a href="#CategoricalClassification-148"><span class="linenos">148</span></a>                        <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification-149"><a href="#CategoricalClassification-149"><span class="linenos">149</span></a>
+</span><span id="CategoricalClassification-150"><a href="#CategoricalClassification-150"><span class="linenos">150</span></a>            <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">n_features</span><span class="p">:</span>
+</span><span id="CategoricalClassification-151"><a href="#CategoricalClassification-151"><span class="linenos">151</span></a>                <span class="c1"># Fill out the rest of the dataset</span>
+</span><span id="CategoricalClassification-152"><a href="#CategoricalClassification-152"><span class="linenos">152</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">n_features</span><span class="p">):</span>
+</span><span id="CategoricalClassification-153"><a href="#CategoricalClassification-153"><span class="linenos">153</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-154"><a href="#CategoricalClassification-154"><span class="linenos">154</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-155"><a href="#CategoricalClassification-155"><span class="linenos">155</span></a>                        <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification-156"><a href="#CategoricalClassification-156"><span class="linenos">156</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-157"><a href="#CategoricalClassification-157"><span class="linenos">157</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification-158"><a href="#CategoricalClassification-158"><span class="linenos">158</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification-159"><a href="#CategoricalClassification-159"><span class="linenos">159</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification-160"><a href="#CategoricalClassification-160"><span class="linenos">160</span></a>                    <span class="p">)</span>
+</span><span id="CategoricalClassification-161"><a href="#CategoricalClassification-161"><span class="linenos">161</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification-162"><a href="#CategoricalClassification-162"><span class="linenos">162</span></a>
+</span><span id="CategoricalClassification-163"><a href="#CategoricalClassification-163"><span class="linenos">163</span></a>        <span class="k">return</span> <span class="n">X</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-164"><a href="#CategoricalClassification-164"><span class="linenos">164</span></a>
+</span><span id="CategoricalClassification-165"><a href="#CategoricalClassification-165"><span class="linenos">165</span></a>    <span class="k">def</span> <span class="nf">_configure_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-166"><a href="#CategoricalClassification-166"><span class="linenos">166</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-167"><a href="#CategoricalClassification-167"><span class="linenos">167</span></a>        <span class="n">feature_attributes</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">list</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-168"><a href="#CategoricalClassification-168"><span class="linenos">168</span></a>        <span class="n">n_samples</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="CategoricalClassification-169"><a href="#CategoricalClassification-169"><span class="linenos">169</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-170"><a href="#CategoricalClassification-170"><span class="linenos">170</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-171"><a href="#CategoricalClassification-171"><span class="linenos">171</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
+</span><span id="CategoricalClassification-172"><a href="#CategoricalClassification-172"><span class="linenos">172</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
+</span><span id="CategoricalClassification-173"><a href="#CategoricalClassification-173"><span class="linenos">173</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-174"><a href="#CategoricalClassification-174"><span class="linenos">174</span></a>
+</span><span id="CategoricalClassification-175"><a href="#CategoricalClassification-175"><span class="linenos">175</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-176"><a href="#CategoricalClassification-176"><span class="linenos">176</span></a><span class="sd">        Helper function, calls _generate_feature with appropriate parameters based on feature_attributes</span>
+</span><span id="CategoricalClassification-177"><a href="#CategoricalClassification-177"><span class="linenos">177</span></a><span class="sd">        :param feature_attributes: either integer (cardinality) or list of feature attributes</span>
+</span><span id="CategoricalClassification-178"><a href="#CategoricalClassification-178"><span class="linenos">178</span></a><span class="sd">        :param n_samples: number of samples in dataset</span>
+</span><span id="CategoricalClassification-179"><a href="#CategoricalClassification-179"><span class="linenos">179</span></a><span class="sd">        :param ensure_rep: ensures all values are represented at least once in the feature vector</span>
+</span><span id="CategoricalClassification-180"><a href="#CategoricalClassification-180"><span class="linenos">180</span></a><span class="sd">        :param random_values: randomly picked values for vec if true, otherwise values range from [low, cardinality] with by 1</span>
+</span><span id="CategoricalClassification-181"><a href="#CategoricalClassification-181"><span class="linenos">181</span></a><span class="sd">        :param low: lower bound of random feature vector values</span>
+</span><span id="CategoricalClassification-182"><a href="#CategoricalClassification-182"><span class="linenos">182</span></a><span class="sd">        :param high: upper bound of random feature vector values</span>
+</span><span id="CategoricalClassification-183"><a href="#CategoricalClassification-183"><span class="linenos">183</span></a><span class="sd">        :return: feature vector</span>
+</span><span id="CategoricalClassification-184"><a href="#CategoricalClassification-184"><span class="linenos">184</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-185"><a href="#CategoricalClassification-185"><span class="linenos">185</span></a>
+</span><span id="CategoricalClassification-186"><a href="#CategoricalClassification-186"><span class="linenos">186</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_attributes</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-187"><a href="#CategoricalClassification-187"><span class="linenos">187</span></a>            <span class="c1"># feature_cardinality is just an integer, generate feature either with random values or</span>
+</span><span id="CategoricalClassification-188"><a href="#CategoricalClassification-188"><span class="linenos">188</span></a>            <span class="c1"># [low, low+cardinality]</span>
+</span><span id="CategoricalClassification-189"><a href="#CategoricalClassification-189"><span class="linenos">189</span></a>            <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-190"><a href="#CategoricalClassification-190"><span class="linenos">190</span></a>                <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-191"><a href="#CategoricalClassification-191"><span class="linenos">191</span></a>                <span class="n">cardinality</span><span class="o">=</span><span class="n">feature_attributes</span><span class="p">,</span>
+</span><span id="CategoricalClassification-192"><a href="#CategoricalClassification-192"><span class="linenos">192</span></a>                <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-193"><a href="#CategoricalClassification-193"><span class="linenos">193</span></a>                <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification-194"><a href="#CategoricalClassification-194"><span class="linenos">194</span></a>                <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification-195"><a href="#CategoricalClassification-195"><span class="linenos">195</span></a>                <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification-196"><a href="#CategoricalClassification-196"><span class="linenos">196</span></a>            <span class="p">)</span>
+</span><span id="CategoricalClassification-197"><a href="#CategoricalClassification-197"><span class="linenos">197</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-198"><a href="#CategoricalClassification-198"><span class="linenos">198</span></a>            <span class="c1"># feature_cardinality is a list of [value_domain, value_frequencies]</span>
+</span><span id="CategoricalClassification-199"><a href="#CategoricalClassification-199"><span class="linenos">199</span></a>            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_attributes</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-200"><a href="#CategoricalClassification-200"><span class="linenos">200</span></a>                <span class="n">value_domain</span><span class="p">,</span> <span class="n">value_frequencies</span> <span class="o">=</span> <span class="n">feature_attributes</span>
+</span><span id="CategoricalClassification-201"><a href="#CategoricalClassification-201"><span class="linenos">201</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-202"><a href="#CategoricalClassification-202"><span class="linenos">202</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-203"><a href="#CategoricalClassification-203"><span class="linenos">203</span></a>                    <span class="n">vec</span><span class="o">=</span><span class="n">value_domain</span><span class="p">,</span>
+</span><span id="CategoricalClassification-204"><a href="#CategoricalClassification-204"><span class="linenos">204</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-205"><a href="#CategoricalClassification-205"><span class="linenos">205</span></a>                    <span class="n">p</span><span class="o">=</span><span class="n">value_frequencies</span><span class="p">,</span>
+</span><span id="CategoricalClassification-206"><a href="#CategoricalClassification-206"><span class="linenos">206</span></a>                <span class="p">)</span>
+</span><span id="CategoricalClassification-207"><a href="#CategoricalClassification-207"><span class="linenos">207</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-208"><a href="#CategoricalClassification-208"><span class="linenos">208</span></a>                <span class="c1"># feature_cardinality is value_domain (list of values for feature)</span>
+</span><span id="CategoricalClassification-209"><a href="#CategoricalClassification-209"><span class="linenos">209</span></a>                <span class="n">value_domain</span> <span class="o">=</span> <span class="n">feature_attributes</span>
+</span><span id="CategoricalClassification-210"><a href="#CategoricalClassification-210"><span class="linenos">210</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-211"><a href="#CategoricalClassification-211"><span class="linenos">211</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-212"><a href="#CategoricalClassification-212"><span class="linenos">212</span></a>                    <span class="n">vec</span><span class="o">=</span><span class="n">value_domain</span><span class="p">,</span>
+</span><span id="CategoricalClassification-213"><a href="#CategoricalClassification-213"><span class="linenos">213</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-214"><a href="#CategoricalClassification-214"><span class="linenos">214</span></a>                <span class="p">)</span>
+</span><span id="CategoricalClassification-215"><a href="#CategoricalClassification-215"><span class="linenos">215</span></a>
+</span><span id="CategoricalClassification-216"><a href="#CategoricalClassification-216"><span class="linenos">216</span></a>        <span class="k">return</span> <span class="n">x</span>
+</span><span id="CategoricalClassification-217"><a href="#CategoricalClassification-217"><span class="linenos">217</span></a>
+</span><span id="CategoricalClassification-218"><a href="#CategoricalClassification-218"><span class="linenos">218</span></a>    <span class="k">def</span> <span class="nf">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-219"><a href="#CategoricalClassification-219"><span class="linenos">219</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-220"><a href="#CategoricalClassification-220"><span class="linenos">220</span></a>        <span class="n">size</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="CategoricalClassification-221"><a href="#CategoricalClassification-221"><span class="linenos">221</span></a>        <span class="n">vec</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification-222"><a href="#CategoricalClassification-222"><span class="linenos">222</span></a>        <span class="n">cardinality</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
+</span><span id="CategoricalClassification-223"><a href="#CategoricalClassification-223"><span class="linenos">223</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-224"><a href="#CategoricalClassification-224"><span class="linenos">224</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-225"><a href="#CategoricalClassification-225"><span class="linenos">225</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
+</span><span id="CategoricalClassification-226"><a href="#CategoricalClassification-226"><span class="linenos">226</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
+</span><span id="CategoricalClassification-227"><a href="#CategoricalClassification-227"><span class="linenos">227</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification-228"><a href="#CategoricalClassification-228"><span class="linenos">228</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-229"><a href="#CategoricalClassification-229"><span class="linenos">229</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-230"><a href="#CategoricalClassification-230"><span class="linenos">230</span></a><span class="sd">        Generates feature vector of length size. Default probability density distribution is approximately normal, centred around a randomly picked value.</span>
+</span><span id="CategoricalClassification-231"><a href="#CategoricalClassification-231"><span class="linenos">231</span></a><span class="sd">        :param vec: list of feature values</span>
+</span><span id="CategoricalClassification-232"><a href="#CategoricalClassification-232"><span class="linenos">232</span></a><span class="sd">        :param cardinality: single value cardinality</span>
+</span><span id="CategoricalClassification-233"><a href="#CategoricalClassification-233"><span class="linenos">233</span></a><span class="sd">        :param size: length of feature vector</span>
+</span><span id="CategoricalClassification-234"><a href="#CategoricalClassification-234"><span class="linenos">234</span></a><span class="sd">        :param ensure_rep: ensures all values are represented at least once in the feature vector</span>
+</span><span id="CategoricalClassification-235"><a href="#CategoricalClassification-235"><span class="linenos">235</span></a><span class="sd">        :param random_values: randomly picked values for vec if true, otherwise values range from [low, cardinality] with by 1</span>
+</span><span id="CategoricalClassification-236"><a href="#CategoricalClassification-236"><span class="linenos">236</span></a><span class="sd">        :param low: lower bound of random feature vector values</span>
+</span><span id="CategoricalClassification-237"><a href="#CategoricalClassification-237"><span class="linenos">237</span></a><span class="sd">        :param high: upper bound of random feature vector values</span>
+</span><span id="CategoricalClassification-238"><a href="#CategoricalClassification-238"><span class="linenos">238</span></a><span class="sd">        :param p: list of probabilities of each value</span>
+</span><span id="CategoricalClassification-239"><a href="#CategoricalClassification-239"><span class="linenos">239</span></a><span class="sd">        :return: feature vector x</span>
+</span><span id="CategoricalClassification-240"><a href="#CategoricalClassification-240"><span class="linenos">240</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-241"><a href="#CategoricalClassification-241"><span class="linenos">241</span></a>
+</span><span id="CategoricalClassification-242"><a href="#CategoricalClassification-242"><span class="linenos">242</span></a>        <span class="k">if</span> <span class="n">vec</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification-243"><a href="#CategoricalClassification-243"><span class="linenos">243</span></a>            <span class="k">if</span> <span class="n">random_values</span><span class="p">:</span>
+</span><span id="CategoricalClassification-244"><a href="#CategoricalClassification-244"><span class="linenos">244</span></a>                <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="n">low</span><span class="p">,</span> <span class="n">high</span> <span class="o">+</span> <span class="mi">1</span><span class="p">),</span> <span class="n">cardinality</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="CategoricalClassification-245"><a href="#CategoricalClassification-245"><span class="linenos">245</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-246"><a href="#CategoricalClassification-246"><span class="linenos">246</span></a>                <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">low</span><span class="p">,</span> <span class="n">low</span> <span class="o">+</span> <span class="n">cardinality</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification-247"><a href="#CategoricalClassification-247"><span class="linenos">247</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-248"><a href="#CategoricalClassification-248"><span class="linenos">248</span></a>            <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">vec</span><span class="p">)</span>
+</span><span id="CategoricalClassification-249"><a href="#CategoricalClassification-249"><span class="linenos">249</span></a>
+</span><span id="CategoricalClassification-250"><a href="#CategoricalClassification-250"><span class="linenos">250</span></a>        <span class="k">if</span> <span class="n">p</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification-251"><a href="#CategoricalClassification-251"><span class="linenos">251</span></a>            <span class="n">v_shift</span> <span class="o">=</span> <span class="n">vec</span> <span class="o">-</span> <span class="n">vec</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">))]</span>
+</span><span id="CategoricalClassification-252"><a href="#CategoricalClassification-252"><span class="linenos">252</span></a>            <span class="n">p</span> <span class="o">=</span> <span class="n">norm</span><span class="o">.</span><span class="n">pdf</span><span class="p">(</span><span class="n">v_shift</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="mi">3</span><span class="p">)</span>
+</span><span id="CategoricalClassification-253"><a href="#CategoricalClassification-253"><span class="linenos">253</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-254"><a href="#CategoricalClassification-254"><span class="linenos">254</span></a>            <span class="n">p</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">p</span><span class="p">)</span>
+</span><span id="CategoricalClassification-255"><a href="#CategoricalClassification-255"><span class="linenos">255</span></a>
+</span><span id="CategoricalClassification-256"><a href="#CategoricalClassification-256"><span class="linenos">256</span></a>        <span class="n">p</span> <span class="o">=</span> <span class="n">p</span> <span class="o">/</span> <span class="n">p</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span>
+</span><span id="CategoricalClassification-257"><a href="#CategoricalClassification-257"><span class="linenos">257</span></a>
+</span><span id="CategoricalClassification-258"><a href="#CategoricalClassification-258"><span class="linenos">258</span></a>        <span class="k">if</span> <span class="n">ensure_rep</span> <span class="ow">and</span> <span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">)</span> <span class="o">&lt;</span> <span class="n">size</span><span class="p">:</span>
+</span><span id="CategoricalClassification-259"><a href="#CategoricalClassification-259"><span class="linenos">259</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">vec</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="p">(</span><span class="n">size</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">)),</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">)</span>
+</span><span id="CategoricalClassification-260"><a href="#CategoricalClassification-260"><span class="linenos">260</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">sampled_values</span><span class="p">,</span> <span class="n">vec</span><span class="p">)</span>
+</span><span id="CategoricalClassification-261"><a href="#CategoricalClassification-261"><span class="linenos">261</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-262"><a href="#CategoricalClassification-262"><span class="linenos">262</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">vec</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="n">size</span><span class="p">,</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">)</span>
+</span><span id="CategoricalClassification-263"><a href="#CategoricalClassification-263"><span class="linenos">263</span></a>
+</span><span id="CategoricalClassification-264"><a href="#CategoricalClassification-264"><span class="linenos">264</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">sampled_values</span><span class="p">)</span>
+</span><span id="CategoricalClassification-265"><a href="#CategoricalClassification-265"><span class="linenos">265</span></a>        <span class="k">return</span> <span class="n">sampled_values</span>
+</span><span id="CategoricalClassification-266"><a href="#CategoricalClassification-266"><span class="linenos">266</span></a>
+</span><span id="CategoricalClassification-267"><a href="#CategoricalClassification-267"><span class="linenos">267</span></a>    <span class="k">def</span> <span class="nf">generate_combinations</span><span class="p">(</span>
+</span><span id="CategoricalClassification-268"><a href="#CategoricalClassification-268"><span class="linenos">268</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-269"><a href="#CategoricalClassification-269"><span class="linenos">269</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-270"><a href="#CategoricalClassification-270"><span class="linenos">270</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-271"><a href="#CategoricalClassification-271"><span class="linenos">271</span></a>        <span class="n">combination_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification-272"><a href="#CategoricalClassification-272"><span class="linenos">272</span></a>        <span class="n">combination_type</span><span class="p">:</span> <span class="n">Literal</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
+</span><span id="CategoricalClassification-273"><a href="#CategoricalClassification-273"><span class="linenos">273</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-274"><a href="#CategoricalClassification-274"><span class="linenos">274</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-275"><a href="#CategoricalClassification-275"><span class="linenos">275</span></a><span class="sd">        Generates linear, nonlinear, or custom combinations within feature vectors in given dataset X</span>
+</span><span id="CategoricalClassification-276"><a href="#CategoricalClassification-276"><span class="linenos">276</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification-277"><a href="#CategoricalClassification-277"><span class="linenos">277</span></a><span class="sd">        :param feature_indices: indexes of features to be in combination</span>
+</span><span id="CategoricalClassification-278"><a href="#CategoricalClassification-278"><span class="linenos">278</span></a><span class="sd">        :param combination_function: optional custom function for combining feature vectors</span>
+</span><span id="CategoricalClassification-279"><a href="#CategoricalClassification-279"><span class="linenos">279</span></a><span class="sd">        :param combination_type: string flag, either liner or nonlinear, defining combination type</span>
+</span><span id="CategoricalClassification-280"><a href="#CategoricalClassification-280"><span class="linenos">280</span></a><span class="sd">        :return: X with added resultant feature</span>
+</span><span id="CategoricalClassification-281"><a href="#CategoricalClassification-281"><span class="linenos">281</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-282"><a href="#CategoricalClassification-282"><span class="linenos">282</span></a>
+</span><span id="CategoricalClassification-283"><a href="#CategoricalClassification-283"><span class="linenos">283</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification-284"><a href="#CategoricalClassification-284"><span class="linenos">284</span></a>
+</span><span id="CategoricalClassification-285"><a href="#CategoricalClassification-285"><span class="linenos">285</span></a>        <span class="k">if</span> <span class="n">combination_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification-286"><a href="#CategoricalClassification-286"><span class="linenos">286</span></a>            <span class="k">if</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification-287"><a href="#CategoricalClassification-287"><span class="linenos">287</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification-288"><a href="#CategoricalClassification-288"><span class="linenos">288</span></a>            <span class="k">elif</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification-289"><a href="#CategoricalClassification-289"><span class="linenos">289</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="CategoricalClassification-290"><a href="#CategoricalClassification-290"><span class="linenos">290</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-291"><a href="#CategoricalClassification-291"><span class="linenos">291</span></a>            <span class="n">combination_type</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">combination_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
+</span><span id="CategoricalClassification-292"><a href="#CategoricalClassification-292"><span class="linenos">292</span></a>
+</span><span id="CategoricalClassification-293"><a href="#CategoricalClassification-293"><span class="linenos">293</span></a>        <span class="n">combination_result</span> <span class="o">=</span> <span class="n">combination_function</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
+</span><span id="CategoricalClassification-294"><a href="#CategoricalClassification-294"><span class="linenos">294</span></a>
+</span><span id="CategoricalClassification-295"><a href="#CategoricalClassification-295"><span class="linenos">295</span></a>        <span class="n">combination_ix</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="CategoricalClassification-296"><a href="#CategoricalClassification-296"><span class="linenos">296</span></a>
+</span><span id="CategoricalClassification-297"><a href="#CategoricalClassification-297"><span class="linenos">297</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="CategoricalClassification-298"><a href="#CategoricalClassification-298"><span class="linenos">298</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="CategoricalClassification-299"><a href="#CategoricalClassification-299"><span class="linenos">299</span></a>            <span class="s1">&#39;combination_type&#39;</span><span class="p">:</span> <span class="n">combination_type</span><span class="p">,</span>
+</span><span id="CategoricalClassification-300"><a href="#CategoricalClassification-300"><span class="linenos">300</span></a>            <span class="s1">&#39;combination_ix&#39;</span><span class="p">:</span> <span class="n">combination_ix</span><span class="p">,</span>
+</span><span id="CategoricalClassification-301"><a href="#CategoricalClassification-301"><span class="linenos">301</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification-302"><a href="#CategoricalClassification-302"><span class="linenos">302</span></a>
+</span><span id="CategoricalClassification-303"><a href="#CategoricalClassification-303"><span class="linenos">303</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">combination_result</span><span class="p">))</span>
+</span><span id="CategoricalClassification-304"><a href="#CategoricalClassification-304"><span class="linenos">304</span></a>
+</span><span id="CategoricalClassification-305"><a href="#CategoricalClassification-305"><span class="linenos">305</span></a>    <span class="k">def</span> <span class="nf">_xor</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-306"><a href="#CategoricalClassification-306"><span class="linenos">306</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-307"><a href="#CategoricalClassification-307"><span class="linenos">307</span></a><span class="sd">        Performs bitwise XOR operation on two integer arrays</span>
+</span><span id="CategoricalClassification-308"><a href="#CategoricalClassification-308"><span class="linenos">308</span></a><span class="sd">        :param arr: features to perform XOR operation on</span>
+</span><span id="CategoricalClassification-309"><a href="#CategoricalClassification-309"><span class="linenos">309</span></a><span class="sd">        :return: bitwise XOR result</span>
+</span><span id="CategoricalClassification-310"><a href="#CategoricalClassification-310"><span class="linenos">310</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-311"><a href="#CategoricalClassification-311"><span class="linenos">311</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-312"><a href="#CategoricalClassification-312"><span class="linenos">312</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="CategoricalClassification-313"><a href="#CategoricalClassification-313"><span class="linenos">313</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="CategoricalClassification-314"><a href="#CategoricalClassification-314"><span class="linenos">314</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="CategoricalClassification-315"><a href="#CategoricalClassification-315"><span class="linenos">315</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-316"><a href="#CategoricalClassification-316"><span class="linenos">316</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
+</span><span id="CategoricalClassification-317"><a href="#CategoricalClassification-317"><span class="linenos">317</span></a>
+</span><span id="CategoricalClassification-318"><a href="#CategoricalClassification-318"><span class="linenos">318</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-319"><a href="#CategoricalClassification-319"><span class="linenos">319</span></a>
+</span><span id="CategoricalClassification-320"><a href="#CategoricalClassification-320"><span class="linenos">320</span></a>    <span class="k">def</span> <span class="nf">_and</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-321"><a href="#CategoricalClassification-321"><span class="linenos">321</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-322"><a href="#CategoricalClassification-322"><span class="linenos">322</span></a><span class="sd">        Performs bitwise AND operation on two integer arrays</span>
+</span><span id="CategoricalClassification-323"><a href="#CategoricalClassification-323"><span class="linenos">323</span></a><span class="sd">        :param arr: features to perform AND operation on</span>
+</span><span id="CategoricalClassification-324"><a href="#CategoricalClassification-324"><span class="linenos">324</span></a><span class="sd">        :return: bitwise AND result</span>
+</span><span id="CategoricalClassification-325"><a href="#CategoricalClassification-325"><span class="linenos">325</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-326"><a href="#CategoricalClassification-326"><span class="linenos">326</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-327"><a href="#CategoricalClassification-327"><span class="linenos">327</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="CategoricalClassification-328"><a href="#CategoricalClassification-328"><span class="linenos">328</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="CategoricalClassification-329"><a href="#CategoricalClassification-329"><span class="linenos">329</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="CategoricalClassification-330"><a href="#CategoricalClassification-330"><span class="linenos">330</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-331"><a href="#CategoricalClassification-331"><span class="linenos">331</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_and</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
+</span><span id="CategoricalClassification-332"><a href="#CategoricalClassification-332"><span class="linenos">332</span></a>
+</span><span id="CategoricalClassification-333"><a href="#CategoricalClassification-333"><span class="linenos">333</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-334"><a href="#CategoricalClassification-334"><span class="linenos">334</span></a>
+</span><span id="CategoricalClassification-335"><a href="#CategoricalClassification-335"><span class="linenos">335</span></a>    <span class="k">def</span> <span class="nf">_or</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-336"><a href="#CategoricalClassification-336"><span class="linenos">336</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-337"><a href="#CategoricalClassification-337"><span class="linenos">337</span></a><span class="sd">        Performs bitwise OR operation on two integer arrays</span>
+</span><span id="CategoricalClassification-338"><a href="#CategoricalClassification-338"><span class="linenos">338</span></a><span class="sd">        :param arr: features to perform OR operation on</span>
+</span><span id="CategoricalClassification-339"><a href="#CategoricalClassification-339"><span class="linenos">339</span></a><span class="sd">        :return: bitwise OR result</span>
+</span><span id="CategoricalClassification-340"><a href="#CategoricalClassification-340"><span class="linenos">340</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-341"><a href="#CategoricalClassification-341"><span class="linenos">341</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-342"><a href="#CategoricalClassification-342"><span class="linenos">342</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="CategoricalClassification-343"><a href="#CategoricalClassification-343"><span class="linenos">343</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="CategoricalClassification-344"><a href="#CategoricalClassification-344"><span class="linenos">344</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="CategoricalClassification-345"><a href="#CategoricalClassification-345"><span class="linenos">345</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-346"><a href="#CategoricalClassification-346"><span class="linenos">346</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_or</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
+</span><span id="CategoricalClassification-347"><a href="#CategoricalClassification-347"><span class="linenos">347</span></a>
+</span><span id="CategoricalClassification-348"><a href="#CategoricalClassification-348"><span class="linenos">348</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-349"><a href="#CategoricalClassification-349"><span class="linenos">349</span></a>
+</span><span id="CategoricalClassification-350"><a href="#CategoricalClassification-350"><span class="linenos">350</span></a>    <span class="k">def</span> <span class="nf">generate_correlated</span><span class="p">(</span>
+</span><span id="CategoricalClassification-351"><a href="#CategoricalClassification-351"><span class="linenos">351</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-352"><a href="#CategoricalClassification-352"><span class="linenos">352</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-353"><a href="#CategoricalClassification-353"><span class="linenos">353</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-354"><a href="#CategoricalClassification-354"><span class="linenos">354</span></a>        <span class="n">r</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.8</span><span class="p">,</span>
+</span><span id="CategoricalClassification-355"><a href="#CategoricalClassification-355"><span class="linenos">355</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-356"><a href="#CategoricalClassification-356"><span class="linenos">356</span></a>
+</span><span id="CategoricalClassification-357"><a href="#CategoricalClassification-357"><span class="linenos">357</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-358"><a href="#CategoricalClassification-358"><span class="linenos">358</span></a><span class="sd">        Generates correlated features using the given feature indices. Correlation is based on cosine of angle between vectors with mean 0.</span>
+</span><span id="CategoricalClassification-359"><a href="#CategoricalClassification-359"><span class="linenos">359</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification-360"><a href="#CategoricalClassification-360"><span class="linenos">360</span></a><span class="sd">        :param feature_indices: indices of features to generate correlated feature to</span>
+</span><span id="CategoricalClassification-361"><a href="#CategoricalClassification-361"><span class="linenos">361</span></a><span class="sd">        :param r: (Pearson) correlation factor</span>
+</span><span id="CategoricalClassification-362"><a href="#CategoricalClassification-362"><span class="linenos">362</span></a><span class="sd">        :return: X with generated correlated  features</span>
+</span><span id="CategoricalClassification-363"><a href="#CategoricalClassification-363"><span class="linenos">363</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-364"><a href="#CategoricalClassification-364"><span class="linenos">364</span></a>
+</span><span id="CategoricalClassification-365"><a href="#CategoricalClassification-365"><span class="linenos">365</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-366"><a href="#CategoricalClassification-366"><span class="linenos">366</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
+</span><span id="CategoricalClassification-367"><a href="#CategoricalClassification-367"><span class="linenos">367</span></a>
+</span><span id="CategoricalClassification-368"><a href="#CategoricalClassification-368"><span class="linenos">368</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="CategoricalClassification-369"><a href="#CategoricalClassification-369"><span class="linenos">369</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)),</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification-370"><a href="#CategoricalClassification-370"><span class="linenos">370</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-371"><a href="#CategoricalClassification-371"><span class="linenos">371</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="CategoricalClassification-372"><a href="#CategoricalClassification-372"><span class="linenos">372</span></a>
+</span><span id="CategoricalClassification-373"><a href="#CategoricalClassification-373"><span class="linenos">373</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification-374"><a href="#CategoricalClassification-374"><span class="linenos">374</span></a>        <span class="n">transposed</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
+</span><span id="CategoricalClassification-375"><a href="#CategoricalClassification-375"><span class="linenos">375</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification-376"><a href="#CategoricalClassification-376"><span class="linenos">376</span></a>
+</span><span id="CategoricalClassification-377"><a href="#CategoricalClassification-377"><span class="linenos">377</span></a>        <span class="k">for</span> <span class="n">t</span> <span class="ow">in</span> <span class="n">transposed</span><span class="p">:</span>
+</span><span id="CategoricalClassification-378"><a href="#CategoricalClassification-378"><span class="linenos">378</span></a>            <span class="n">theta</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arccos</span><span class="p">(</span><span class="n">r</span><span class="p">)</span>
+</span><span id="CategoricalClassification-379"><a href="#CategoricalClassification-379"><span class="linenos">379</span></a>            <span class="n">t_standard</span> <span class="o">=</span> <span class="p">(</span><span class="n">t</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">t</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">t</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
+</span><span id="CategoricalClassification-380"><a href="#CategoricalClassification-380"><span class="linenos">380</span></a>
+</span><span id="CategoricalClassification-381"><a href="#CategoricalClassification-381"><span class="linenos">381</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">normal</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">t_standard</span><span class="p">))</span>
+</span><span id="CategoricalClassification-382"><a href="#CategoricalClassification-382"><span class="linenos">382</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="p">(</span><span class="n">rand</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">rand</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">rand</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
+</span><span id="CategoricalClassification-383"><a href="#CategoricalClassification-383"><span class="linenos">383</span></a>
+</span><span id="CategoricalClassification-384"><a href="#CategoricalClassification-384"><span class="linenos">384</span></a>            <span class="n">M</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">t_standard</span><span class="p">,</span> <span class="n">rand</span><span class="p">))</span>
+</span><span id="CategoricalClassification-385"><a href="#CategoricalClassification-385"><span class="linenos">385</span></a>            <span class="n">M_centred</span> <span class="o">=</span> <span class="p">(</span><span class="n">M</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">M</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))</span>
+</span><span id="CategoricalClassification-386"><a href="#CategoricalClassification-386"><span class="linenos">386</span></a>
+</span><span id="CategoricalClassification-387"><a href="#CategoricalClassification-387"><span class="linenos">387</span></a>            <span class="n">Id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">eye</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">t</span><span class="p">))</span>
+</span><span id="CategoricalClassification-388"><a href="#CategoricalClassification-388"><span class="linenos">388</span></a>            <span class="n">Q</span> <span class="o">=</span> <span class="n">qr</span><span class="p">(</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="p">[</span><span class="mi">0</span><span class="p">]],</span> <span class="n">mode</span><span class="o">=</span><span class="s1">&#39;economic&#39;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="CategoricalClassification-389"><a href="#CategoricalClassification-389"><span class="linenos">389</span></a>            <span class="n">P</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Q</span><span class="p">,</span> <span class="n">Q</span><span class="o">.</span><span class="n">T</span><span class="p">)</span>
+</span><span id="CategoricalClassification-390"><a href="#CategoricalClassification-390"><span class="linenos">390</span></a>            <span class="n">orthogonal_projection</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Id</span> <span class="o">-</span> <span class="n">P</span><span class="p">,</span> <span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">])</span>
+</span><span id="CategoricalClassification-391"><a href="#CategoricalClassification-391"><span class="linenos">391</span></a>            <span class="n">M_orthogonal</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">],</span> <span class="n">orthogonal_projection</span><span class="p">))</span>
+</span><span id="CategoricalClassification-392"><a href="#CategoricalClassification-392"><span class="linenos">392</span></a>
+</span><span id="CategoricalClassification-393"><a href="#CategoricalClassification-393"><span class="linenos">393</span></a>            <span class="n">Y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">M_orthogonal</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">M_orthogonal</span> <span class="o">**</span> <span class="mi">2</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))))</span>
+</span><span id="CategoricalClassification-394"><a href="#CategoricalClassification-394"><span class="linenos">394</span></a>            <span class="n">corr</span> <span class="o">=</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">tan</span><span class="p">(</span><span class="n">theta</span><span class="p">))</span> <span class="o">*</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">]</span>
+</span><span id="CategoricalClassification-395"><a href="#CategoricalClassification-395"><span class="linenos">395</span></a>
+</span><span id="CategoricalClassification-396"><a href="#CategoricalClassification-396"><span class="linenos">396</span></a>            <span class="n">correlated_features</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">corr</span><span class="p">)</span>
+</span><span id="CategoricalClassification-397"><a href="#CategoricalClassification-397"><span class="linenos">397</span></a>
+</span><span id="CategoricalClassification-398"><a href="#CategoricalClassification-398"><span class="linenos">398</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">correlated_features</span><span class="p">)</span>
+</span><span id="CategoricalClassification-399"><a href="#CategoricalClassification-399"><span class="linenos">399</span></a>
+</span><span id="CategoricalClassification-400"><a href="#CategoricalClassification-400"><span class="linenos">400</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="CategoricalClassification-401"><a href="#CategoricalClassification-401"><span class="linenos">401</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="CategoricalClassification-402"><a href="#CategoricalClassification-402"><span class="linenos">402</span></a>            <span class="s1">&#39;correlated_indices&#39;</span><span class="p">:</span> <span class="n">correlated_ixs</span><span class="p">,</span>
+</span><span id="CategoricalClassification-403"><a href="#CategoricalClassification-403"><span class="linenos">403</span></a>            <span class="s1">&#39;correlation_factor&#39;</span><span class="p">:</span> <span class="n">r</span><span class="p">,</span>
+</span><span id="CategoricalClassification-404"><a href="#CategoricalClassification-404"><span class="linenos">404</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification-405"><a href="#CategoricalClassification-405"><span class="linenos">405</span></a>
+</span><span id="CategoricalClassification-406"><a href="#CategoricalClassification-406"><span class="linenos">406</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">correlated_features</span><span class="p">))</span>
+</span><span id="CategoricalClassification-407"><a href="#CategoricalClassification-407"><span class="linenos">407</span></a>
+</span><span id="CategoricalClassification-408"><a href="#CategoricalClassification-408"><span class="linenos">408</span></a>    <span class="k">def</span> <span class="nf">generate_duplicates</span><span class="p">(</span>
+</span><span id="CategoricalClassification-409"><a href="#CategoricalClassification-409"><span class="linenos">409</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-410"><a href="#CategoricalClassification-410"><span class="linenos">410</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-411"><a href="#CategoricalClassification-411"><span class="linenos">411</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-412"><a href="#CategoricalClassification-412"><span class="linenos">412</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-413"><a href="#CategoricalClassification-413"><span class="linenos">413</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-414"><a href="#CategoricalClassification-414"><span class="linenos">414</span></a><span class="sd">        Generates duplicate features</span>
+</span><span id="CategoricalClassification-415"><a href="#CategoricalClassification-415"><span class="linenos">415</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification-416"><a href="#CategoricalClassification-416"><span class="linenos">416</span></a><span class="sd">        :param feature_indices: indices of features to duplicate</span>
+</span><span id="CategoricalClassification-417"><a href="#CategoricalClassification-417"><span class="linenos">417</span></a><span class="sd">        :return: dataset with duplicated features</span>
+</span><span id="CategoricalClassification-418"><a href="#CategoricalClassification-418"><span class="linenos">418</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-419"><a href="#CategoricalClassification-419"><span class="linenos">419</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-420"><a href="#CategoricalClassification-420"><span class="linenos">420</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
+</span><span id="CategoricalClassification-421"><a href="#CategoricalClassification-421"><span class="linenos">421</span></a>
+</span><span id="CategoricalClassification-422"><a href="#CategoricalClassification-422"><span class="linenos">422</span></a>        <span class="n">duplicated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">),</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification-423"><a href="#CategoricalClassification-423"><span class="linenos">423</span></a>
+</span><span id="CategoricalClassification-424"><a href="#CategoricalClassification-424"><span class="linenos">424</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification-425"><a href="#CategoricalClassification-425"><span class="linenos">425</span></a>
+</span><span id="CategoricalClassification-426"><a href="#CategoricalClassification-426"><span class="linenos">426</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="CategoricalClassification-427"><a href="#CategoricalClassification-427"><span class="linenos">427</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="CategoricalClassification-428"><a href="#CategoricalClassification-428"><span class="linenos">428</span></a>            <span class="s1">&#39;duplicate_indices&#39;</span><span class="p">:</span> <span class="n">duplicated_ixs</span><span class="p">,</span>
+</span><span id="CategoricalClassification-429"><a href="#CategoricalClassification-429"><span class="linenos">429</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification-430"><a href="#CategoricalClassification-430"><span class="linenos">430</span></a>
+</span><span id="CategoricalClassification-431"><a href="#CategoricalClassification-431"><span class="linenos">431</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">selected_features</span><span class="p">))</span>
+</span><span id="CategoricalClassification-432"><a href="#CategoricalClassification-432"><span class="linenos">432</span></a>
+</span><span id="CategoricalClassification-433"><a href="#CategoricalClassification-433"><span class="linenos">433</span></a>    <span class="k">def</span> <span class="nf">generate_labels</span><span class="p">(</span>
+</span><span id="CategoricalClassification-434"><a href="#CategoricalClassification-434"><span class="linenos">434</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-435"><a href="#CategoricalClassification-435"><span class="linenos">435</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-436"><a href="#CategoricalClassification-436"><span class="linenos">436</span></a>        <span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
+</span><span id="CategoricalClassification-437"><a href="#CategoricalClassification-437"><span class="linenos">437</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">|</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">=</span> <span class="mf">0.5</span><span class="p">,</span>
+</span><span id="CategoricalClassification-438"><a href="#CategoricalClassification-438"><span class="linenos">438</span></a>        <span class="n">k</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
+</span><span id="CategoricalClassification-439"><a href="#CategoricalClassification-439"><span class="linenos">439</span></a>        <span class="n">decision_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification-440"><a href="#CategoricalClassification-440"><span class="linenos">440</span></a>        <span class="n">class_relation</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
+</span><span id="CategoricalClassification-441"><a href="#CategoricalClassification-441"><span class="linenos">441</span></a>        <span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-442"><a href="#CategoricalClassification-442"><span class="linenos">442</span></a>    <span class="p">):</span>
+</span><span id="CategoricalClassification-443"><a href="#CategoricalClassification-443"><span class="linenos">443</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-444"><a href="#CategoricalClassification-444"><span class="linenos">444</span></a><span class="sd">        Generates labels for dataset X</span>
+</span><span id="CategoricalClassification-445"><a href="#CategoricalClassification-445"><span class="linenos">445</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification-446"><a href="#CategoricalClassification-446"><span class="linenos">446</span></a><span class="sd">        :param n: number of class labels</span>
+</span><span id="CategoricalClassification-447"><a href="#CategoricalClassification-447"><span class="linenos">447</span></a><span class="sd">        :param p: class distribution</span>
+</span><span id="CategoricalClassification-448"><a href="#CategoricalClassification-448"><span class="linenos">448</span></a><span class="sd">        :param k: constant</span>
+</span><span id="CategoricalClassification-449"><a href="#CategoricalClassification-449"><span class="linenos">449</span></a><span class="sd">        :param decision_function: optional user-defined decision function</span>
+</span><span id="CategoricalClassification-450"><a href="#CategoricalClassification-450"><span class="linenos">450</span></a><span class="sd">        :param class_relation: string, either &#39;linear&#39;, &#39;nonlinear&#39;, or &#39;cluster&#39;</span>
+</span><span id="CategoricalClassification-451"><a href="#CategoricalClassification-451"><span class="linenos">451</span></a><span class="sd">        :param balance: boolean, whether to balance clustering class labels</span>
+</span><span id="CategoricalClassification-452"><a href="#CategoricalClassification-452"><span class="linenos">452</span></a><span class="sd">        :return: array of labels, corresponding to dataset X</span>
+</span><span id="CategoricalClassification-453"><a href="#CategoricalClassification-453"><span class="linenos">453</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-454"><a href="#CategoricalClassification-454"><span class="linenos">454</span></a>
+</span><span id="CategoricalClassification-455"><a href="#CategoricalClassification-455"><span class="linenos">455</span></a>        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-456"><a href="#CategoricalClassification-456"><span class="linenos">456</span></a>            <span class="k">if</span> <span class="nb">sum</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;sum of values in must be less than 1.0&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-457"><a href="#CategoricalClassification-457"><span class="linenos">457</span></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">n</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;length of p must equal n&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-458"><a href="#CategoricalClassification-458"><span class="linenos">458</span></a>
+</span><span id="CategoricalClassification-459"><a href="#CategoricalClassification-459"><span class="linenos">459</span></a>        <span class="k">if</span> <span class="n">p</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;p must be less than 1.0&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-460"><a href="#CategoricalClassification-460"><span class="linenos">460</span></a>
+</span><span id="CategoricalClassification-461"><a href="#CategoricalClassification-461"><span class="linenos">461</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification-462"><a href="#CategoricalClassification-462"><span class="linenos">462</span></a>
+</span><span id="CategoricalClassification-463"><a href="#CategoricalClassification-463"><span class="linenos">463</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification-464"><a href="#CategoricalClassification-464"><span class="linenos">464</span></a>            <span class="k">if</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification-465"><a href="#CategoricalClassification-465"><span class="linenos">465</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="n">x</span> <span class="o">+</span> <span class="mi">3</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification-466"><a href="#CategoricalClassification-466"><span class="linenos">466</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification-467"><a href="#CategoricalClassification-467"><span class="linenos">467</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="o">+</span> <span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">cos</span><span class="p">(</span><span class="n">x</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification-468"><a href="#CategoricalClassification-468"><span class="linenos">468</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;cluster&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification-469"><a href="#CategoricalClassification-469"><span class="linenos">469</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="CategoricalClassification-470"><a href="#CategoricalClassification-470"><span class="linenos">470</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-471"><a href="#CategoricalClassification-471"><span class="linenos">471</span></a>            <span class="n">class_relation</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">decision_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
+</span><span id="CategoricalClassification-472"><a href="#CategoricalClassification-472"><span class="linenos">472</span></a>
+</span><span id="CategoricalClassification-473"><a href="#CategoricalClassification-473"><span class="linenos">473</span></a>        <span class="n">y</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification-474"><a href="#CategoricalClassification-474"><span class="linenos">474</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification-475"><a href="#CategoricalClassification-475"><span class="linenos">475</span></a>            <span class="k">if</span> <span class="n">n</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="CategoricalClassification-476"><a href="#CategoricalClassification-476"><span class="linenos">476</span></a>                <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">list</span><span class="p">:</span>
+</span><span id="CategoricalClassification-477"><a href="#CategoricalClassification-477"><span class="linenos">477</span></a>                    <span class="n">p</span> <span class="o">=</span> <span class="mi">1</span> <span class="o">/</span> <span class="n">n</span>
+</span><span id="CategoricalClassification-478"><a href="#CategoricalClassification-478"><span class="linenos">478</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">]</span>
+</span><span id="CategoricalClassification-479"><a href="#CategoricalClassification-479"><span class="linenos">479</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="CategoricalClassification-480"><a href="#CategoricalClassification-480"><span class="linenos">480</span></a>                        <span class="n">percentiles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">))</span>
+</span><span id="CategoricalClassification-481"><a href="#CategoricalClassification-481"><span class="linenos">481</span></a>
+</span><span id="CategoricalClassification-482"><a href="#CategoricalClassification-482"><span class="linenos">482</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification-483"><a href="#CategoricalClassification-483"><span class="linenos">483</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
+</span><span id="CategoricalClassification-484"><a href="#CategoricalClassification-484"><span class="linenos">484</span></a>
+</span><span id="CategoricalClassification-485"><a href="#CategoricalClassification-485"><span class="linenos">485</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="CategoricalClassification-486"><a href="#CategoricalClassification-486"><span class="linenos">486</span></a>                    <span class="k">for</span> <span class="n">p_point</span> <span class="ow">in</span> <span class="n">p_points</span><span class="p">:</span>
+</span><span id="CategoricalClassification-487"><a href="#CategoricalClassification-487"><span class="linenos">487</span></a>                        <span class="n">y</span> <span class="o">+=</span> <span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">)</span>
+</span><span id="CategoricalClassification-488"><a href="#CategoricalClassification-488"><span class="linenos">488</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-489"><a href="#CategoricalClassification-489"><span class="linenos">489</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification-490"><a href="#CategoricalClassification-490"><span class="linenos">490</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="o">*</span> <span class="mi">100</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">p</span><span class="p">]</span>
+</span><span id="CategoricalClassification-491"><a href="#CategoricalClassification-491"><span class="linenos">491</span></a>
+</span><span id="CategoricalClassification-492"><a href="#CategoricalClassification-492"><span class="linenos">492</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="CategoricalClassification-493"><a href="#CategoricalClassification-493"><span class="linenos">493</span></a>                        <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">+=</span> <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span>
+</span><span id="CategoricalClassification-494"><a href="#CategoricalClassification-494"><span class="linenos">494</span></a>
+</span><span id="CategoricalClassification-495"><a href="#CategoricalClassification-495"><span class="linenos">495</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">insert</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification-496"><a href="#CategoricalClassification-496"><span class="linenos">496</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">pop</span><span class="p">()</span>
+</span><span id="CategoricalClassification-497"><a href="#CategoricalClassification-497"><span class="linenos">497</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span>
+</span><span id="CategoricalClassification-498"><a href="#CategoricalClassification-498"><span class="linenos">498</span></a>
+</span><span id="CategoricalClassification-499"><a href="#CategoricalClassification-499"><span class="linenos">499</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
+</span><span id="CategoricalClassification-500"><a href="#CategoricalClassification-500"><span class="linenos">500</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">p_points</span><span class="p">)</span>
+</span><span id="CategoricalClassification-501"><a href="#CategoricalClassification-501"><span class="linenos">501</span></a>
+</span><span id="CategoricalClassification-502"><a href="#CategoricalClassification-502"><span class="linenos">502</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="CategoricalClassification-503"><a href="#CategoricalClassification-503"><span class="linenos">503</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span><span class="p">):</span>
+</span><span id="CategoricalClassification-504"><a href="#CategoricalClassification-504"><span class="linenos">504</span></a>                        <span class="n">p_point</span> <span class="o">=</span> <span class="n">p_points</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="CategoricalClassification-505"><a href="#CategoricalClassification-505"><span class="linenos">505</span></a>                        <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-506"><a href="#CategoricalClassification-506"><span class="linenos">506</span></a>                            <span class="k">if</span> <span class="n">decision_boundary</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">:</span>
+</span><span id="CategoricalClassification-507"><a href="#CategoricalClassification-507"><span class="linenos">507</span></a>                                <span class="n">y</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification-508"><a href="#CategoricalClassification-508"><span class="linenos">508</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-509"><a href="#CategoricalClassification-509"><span class="linenos">509</span></a>                <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification-510"><a href="#CategoricalClassification-510"><span class="linenos">510</span></a>                <span class="n">p_point</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">)</span>
+</span><span id="CategoricalClassification-511"><a href="#CategoricalClassification-511"><span class="linenos">511</span></a>                <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification-512"><a href="#CategoricalClassification-512"><span class="linenos">512</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-513"><a href="#CategoricalClassification-513"><span class="linenos">513</span></a>            <span class="k">if</span> <span class="n">p</span> <span class="o">==</span> <span class="mf">0.5</span><span class="p">:</span>
+</span><span id="CategoricalClassification-514"><a href="#CategoricalClassification-514"><span class="linenos">514</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="mf">1.0</span>
+</span><span id="CategoricalClassification-515"><a href="#CategoricalClassification-515"><span class="linenos">515</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-516"><a href="#CategoricalClassification-516"><span class="linenos">516</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span><span class="p">,</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">p</span><span class="p">]</span>
+</span><span id="CategoricalClassification-517"><a href="#CategoricalClassification-517"><span class="linenos">517</span></a>            <span class="n">y</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_cluster_data</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">n</span><span class="p">,</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">,</span> <span class="n">balance</span><span class="o">=</span><span class="n">balance</span><span class="p">)</span>
+</span><span id="CategoricalClassification-518"><a href="#CategoricalClassification-518"><span class="linenos">518</span></a>
+</span><span id="CategoricalClassification-519"><a href="#CategoricalClassification-519"><span class="linenos">519</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="CategoricalClassification-520"><a href="#CategoricalClassification-520"><span class="linenos">520</span></a>            <span class="s1">&#39;labels&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="CategoricalClassification-521"><a href="#CategoricalClassification-521"><span class="linenos">521</span></a>                <span class="s1">&#39;class_relation&#39;</span><span class="p">:</span> <span class="n">class_relation</span><span class="p">,</span>
+</span><span id="CategoricalClassification-522"><a href="#CategoricalClassification-522"><span class="linenos">522</span></a>                <span class="s1">&#39;n_class&#39;</span><span class="p">:</span> <span class="n">n</span><span class="p">,</span>
+</span><span id="CategoricalClassification-523"><a href="#CategoricalClassification-523"><span class="linenos">523</span></a>            <span class="p">},</span>
+</span><span id="CategoricalClassification-524"><a href="#CategoricalClassification-524"><span class="linenos">524</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification-525"><a href="#CategoricalClassification-525"><span class="linenos">525</span></a>
+</span><span id="CategoricalClassification-526"><a href="#CategoricalClassification-526"><span class="linenos">526</span></a>        <span class="k">return</span> <span class="n">y</span>
+</span><span id="CategoricalClassification-527"><a href="#CategoricalClassification-527"><span class="linenos">527</span></a>
+</span><span id="CategoricalClassification-528"><a href="#CategoricalClassification-528"><span class="linenos">528</span></a>    <span class="k">def</span> <span class="nf">_cluster_data</span><span class="p">(</span>
+</span><span id="CategoricalClassification-529"><a href="#CategoricalClassification-529"><span class="linenos">529</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-530"><a href="#CategoricalClassification-530"><span class="linenos">530</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-531"><a href="#CategoricalClassification-531"><span class="linenos">531</span></a>        <span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="CategoricalClassification-532"><a href="#CategoricalClassification-532"><span class="linenos">532</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">|</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mf">1.0</span><span class="p">,</span>
+</span><span id="CategoricalClassification-533"><a href="#CategoricalClassification-533"><span class="linenos">533</span></a>        <span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-534"><a href="#CategoricalClassification-534"><span class="linenos">534</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-535"><a href="#CategoricalClassification-535"><span class="linenos">535</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-536"><a href="#CategoricalClassification-536"><span class="linenos">536</span></a><span class="sd">        Cluster data using kmeans</span>
+</span><span id="CategoricalClassification-537"><a href="#CategoricalClassification-537"><span class="linenos">537</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification-538"><a href="#CategoricalClassification-538"><span class="linenos">538</span></a><span class="sd">        :param n: number of clusters</span>
+</span><span id="CategoricalClassification-539"><a href="#CategoricalClassification-539"><span class="linenos">539</span></a><span class="sd">        :param p: class distribution</span>
+</span><span id="CategoricalClassification-540"><a href="#CategoricalClassification-540"><span class="linenos">540</span></a><span class="sd">        :param balance: balance the clusters according to p</span>
+</span><span id="CategoricalClassification-541"><a href="#CategoricalClassification-541"><span class="linenos">541</span></a><span class="sd">        :return: array of labels, corresponding to dataset X</span>
+</span><span id="CategoricalClassification-542"><a href="#CategoricalClassification-542"><span class="linenos">542</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-543"><a href="#CategoricalClassification-543"><span class="linenos">543</span></a>
+</span><span id="CategoricalClassification-544"><a href="#CategoricalClassification-544"><span class="linenos">544</span></a>        <span class="n">kmeans</span> <span class="o">=</span> <span class="n">KMeans</span><span class="p">(</span><span class="n">n_clusters</span><span class="o">=</span><span class="n">n</span><span class="p">)</span>
+</span><span id="CategoricalClassification-545"><a href="#CategoricalClassification-545"><span class="linenos">545</span></a>
+</span><span id="CategoricalClassification-546"><a href="#CategoricalClassification-546"><span class="linenos">546</span></a>        <span class="n">kmeans</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification-547"><a href="#CategoricalClassification-547"><span class="linenos">547</span></a>
+</span><span id="CategoricalClassification-548"><a href="#CategoricalClassification-548"><span class="linenos">548</span></a>        <span class="n">cluster_labels</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">labels_</span>
+</span><span id="CategoricalClassification-549"><a href="#CategoricalClassification-549"><span class="linenos">549</span></a>
+</span><span id="CategoricalClassification-550"><a href="#CategoricalClassification-550"><span class="linenos">550</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>  <span class="c1"># Fully balanced clusters</span>
+</span><span id="CategoricalClassification-551"><a href="#CategoricalClassification-551"><span class="linenos">551</span></a>            <span class="n">samples_per_cluster</span> <span class="o">=</span> <span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">)</span> <span class="o">//</span> <span class="n">n</span><span class="p">]</span> <span class="o">*</span> <span class="n">n</span>
+</span><span id="CategoricalClassification-552"><a href="#CategoricalClassification-552"><span class="linenos">552</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-553"><a href="#CategoricalClassification-553"><span class="linenos">553</span></a>            <span class="n">samples</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification-554"><a href="#CategoricalClassification-554"><span class="linenos">554</span></a>            <span class="n">samples_per_cluster</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification-555"><a href="#CategoricalClassification-555"><span class="linenos">555</span></a>            <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-556"><a href="#CategoricalClassification-556"><span class="linenos">556</span></a>                <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span> <span class="o">//</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="CategoricalClassification-557"><a href="#CategoricalClassification-557"><span class="linenos">557</span></a>                <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="p">(</span><span class="mi">1</span> <span class="o">-</span> <span class="n">p</span><span class="p">))</span> <span class="o">//</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="CategoricalClassification-558"><a href="#CategoricalClassification-558"><span class="linenos">558</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-559"><a href="#CategoricalClassification-559"><span class="linenos">559</span></a>                <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">==</span> <span class="n">n</span><span class="p">:</span>
+</span><span id="CategoricalClassification-560"><a href="#CategoricalClassification-560"><span class="linenos">560</span></a>                    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">p</span><span class="p">:</span>
+</span><span id="CategoricalClassification-561"><a href="#CategoricalClassification-561"><span class="linenos">561</span></a>                        <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="n">val</span><span class="p">))</span>
+</span><span id="CategoricalClassification-562"><a href="#CategoricalClassification-562"><span class="linenos">562</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-563"><a href="#CategoricalClassification-563"><span class="linenos">563</span></a>                    <span class="k">raise</span> <span class="ne">Exception</span><span class="p">(</span><span class="s1">&#39;Length of balance parameter must equal number of clusters.&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-564"><a href="#CategoricalClassification-564"><span class="linenos">564</span></a>
+</span><span id="CategoricalClassification-565"><a href="#CategoricalClassification-565"><span class="linenos">565</span></a>        <span class="c1"># Adjust cluster sizes</span>
+</span><span id="CategoricalClassification-566"><a href="#CategoricalClassification-566"><span class="linenos">566</span></a>        <span class="k">if</span> <span class="n">balance</span><span class="p">:</span>
+</span><span id="CategoricalClassification-567"><a href="#CategoricalClassification-567"><span class="linenos">567</span></a>            <span class="n">adjustments</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification-568"><a href="#CategoricalClassification-568"><span class="linenos">568</span></a>            <span class="n">overflow_samples</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification-569"><a href="#CategoricalClassification-569"><span class="linenos">569</span></a>            <span class="n">overflow_indices</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification-570"><a href="#CategoricalClassification-570"><span class="linenos">570</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">):</span>
+</span><span id="CategoricalClassification-571"><a href="#CategoricalClassification-571"><span class="linenos">571</span></a>                <span class="n">cluster_size</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">cluster_labels</span> <span class="o">==</span> <span class="n">i</span><span class="p">)</span>
+</span><span id="CategoricalClassification-572"><a href="#CategoricalClassification-572"><span class="linenos">572</span></a>
+</span><span id="CategoricalClassification-573"><a href="#CategoricalClassification-573"><span class="linenos">573</span></a>                <span class="n">adjustment</span> <span class="o">=</span> <span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">-</span> <span class="n">cluster_size</span>
+</span><span id="CategoricalClassification-574"><a href="#CategoricalClassification-574"><span class="linenos">574</span></a>                <span class="n">adjustments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">adjustment</span><span class="p">)</span>
+</span><span id="CategoricalClassification-575"><a href="#CategoricalClassification-575"><span class="linenos">575</span></a>
+</span><span id="CategoricalClassification-576"><a href="#CategoricalClassification-576"><span class="linenos">576</span></a>                <span class="k">if</span> <span class="n">adjustment</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">:</span>  <span class="c1"># Cluter is too large</span>
+</span><span id="CategoricalClassification-577"><a href="#CategoricalClassification-577"><span class="linenos">577</span></a>
+</span><span id="CategoricalClassification-578"><a href="#CategoricalClassification-578"><span class="linenos">578</span></a>                    <span class="n">centroid</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">cluster_centers_</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="CategoricalClassification-579"><a href="#CategoricalClassification-579"><span class="linenos">579</span></a>                    <span class="n">dataset_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">cluster_labels</span> <span class="o">==</span> <span class="n">i</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>  <span class="c1"># Indices of samples in dataset</span>
+</span><span id="CategoricalClassification-580"><a href="#CategoricalClassification-580"><span class="linenos">580</span></a>                    <span class="n">cluster_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="n">dataset_indices</span><span class="p">])</span>
+</span><span id="CategoricalClassification-581"><a href="#CategoricalClassification-581"><span class="linenos">581</span></a>
+</span><span id="CategoricalClassification-582"><a href="#CategoricalClassification-582"><span class="linenos">582</span></a>                    <span class="n">distances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">linalg</span><span class="o">.</span><span class="n">norm</span><span class="p">(</span>
+</span><span id="CategoricalClassification-583"><a href="#CategoricalClassification-583"><span class="linenos">583</span></a>                        <span class="n">cluster_samples</span> <span class="o">-</span> <span class="n">centroid</span><span class="p">,</span>
+</span><span id="CategoricalClassification-584"><a href="#CategoricalClassification-584"><span class="linenos">584</span></a>                        <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="CategoricalClassification-585"><a href="#CategoricalClassification-585"><span class="linenos">585</span></a>                    <span class="p">)</span>  <span class="c1"># Distances of cluster samples to cluster centroid</span>
+</span><span id="CategoricalClassification-586"><a href="#CategoricalClassification-586"><span class="linenos">586</span></a>                    <span class="n">cluster_sample_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">distances</span><span class="p">)</span>
+</span><span id="CategoricalClassification-587"><a href="#CategoricalClassification-587"><span class="linenos">587</span></a>                    <span class="n">dataset_indices_sorted</span> <span class="o">=</span> <span class="n">dataset_indices</span><span class="p">[</span>
+</span><span id="CategoricalClassification-588"><a href="#CategoricalClassification-588"><span class="linenos">588</span></a>                        <span class="n">cluster_sample_indices</span>
+</span><span id="CategoricalClassification-589"><a href="#CategoricalClassification-589"><span class="linenos">589</span></a>                    <span class="p">]</span>  <span class="c1"># Indices of samples sorted by sample distance to cluster centroid</span>
+</span><span id="CategoricalClassification-590"><a href="#CategoricalClassification-590"><span class="linenos">590</span></a>
+</span><span id="CategoricalClassification-591"><a href="#CategoricalClassification-591"><span class="linenos">591</span></a>                    <span class="n">overflow_sample_indices</span> <span class="o">=</span> <span class="n">cluster_sample_indices</span><span class="p">[</span><span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]:]</span>  <span class="c1"># Overflow samples</span>
+</span><span id="CategoricalClassification-592"><a href="#CategoricalClassification-592"><span class="linenos">592</span></a>                    <span class="n">dataset_indices_sorted</span> <span class="o">=</span> <span class="n">dataset_indices_sorted</span><span class="p">[</span>
+</span><span id="CategoricalClassification-593"><a href="#CategoricalClassification-593"><span class="linenos">593</span></a>                                             <span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]:</span>
+</span><span id="CategoricalClassification-594"><a href="#CategoricalClassification-594"><span class="linenos">594</span></a>                    <span class="p">]</span>  <span class="c1"># Dataset indices of overflow samples</span>
+</span><span id="CategoricalClassification-595"><a href="#CategoricalClassification-595"><span class="linenos">595</span></a>
+</span><span id="CategoricalClassification-596"><a href="#CategoricalClassification-596"><span class="linenos">596</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">overflow_sample_indices</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-597"><a href="#CategoricalClassification-597"><span class="linenos">597</span></a>                        <span class="n">overflow_samples</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster_samples</span><span class="p">[</span><span class="n">overflow_sample_indices</span><span class="p">[</span><span class="n">i</span><span class="p">]])</span>
+</span><span id="CategoricalClassification-598"><a href="#CategoricalClassification-598"><span class="linenos">598</span></a>                        <span class="n">overflow_indices</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">dataset_indices_sorted</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
+</span><span id="CategoricalClassification-599"><a href="#CategoricalClassification-599"><span class="linenos">599</span></a>
+</span><span id="CategoricalClassification-600"><a href="#CategoricalClassification-600"><span class="linenos">600</span></a>            <span class="n">overflow_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">overflow_samples</span><span class="p">)</span>
+</span><span id="CategoricalClassification-601"><a href="#CategoricalClassification-601"><span class="linenos">601</span></a>            <span class="n">overflow_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">overflow_indices</span><span class="p">)</span>
+</span><span id="CategoricalClassification-602"><a href="#CategoricalClassification-602"><span class="linenos">602</span></a>
+</span><span id="CategoricalClassification-603"><a href="#CategoricalClassification-603"><span class="linenos">603</span></a>            <span class="c1"># Making adjustments</span>
+</span><span id="CategoricalClassification-604"><a href="#CategoricalClassification-604"><span class="linenos">604</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">):</span>
+</span><span id="CategoricalClassification-605"><a href="#CategoricalClassification-605"><span class="linenos">605</span></a>
+</span><span id="CategoricalClassification-606"><a href="#CategoricalClassification-606"><span class="linenos">606</span></a>                <span class="k">if</span> <span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification-607"><a href="#CategoricalClassification-607"><span class="linenos">607</span></a>                    <span class="n">centroid</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">cluster_centers_</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="CategoricalClassification-608"><a href="#CategoricalClassification-608"><span class="linenos">608</span></a>                    <span class="n">distances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">linalg</span><span class="o">.</span><span class="n">norm</span><span class="p">(</span><span class="n">overflow_samples</span> <span class="o">-</span> <span class="n">centroid</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification-609"><a href="#CategoricalClassification-609"><span class="linenos">609</span></a>
+</span><span id="CategoricalClassification-610"><a href="#CategoricalClassification-610"><span class="linenos">610</span></a>                    <span class="n">closest_sample_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">distances</span><span class="p">)</span>
+</span><span id="CategoricalClassification-611"><a href="#CategoricalClassification-611"><span class="linenos">611</span></a>
+</span><span id="CategoricalClassification-612"><a href="#CategoricalClassification-612"><span class="linenos">612</span></a>                    <span class="n">overflow_indices_sorted</span> <span class="o">=</span> <span class="n">overflow_indices</span><span class="p">[</span><span class="n">closest_sample_indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification-613"><a href="#CategoricalClassification-613"><span class="linenos">613</span></a>
+</span><span id="CategoricalClassification-614"><a href="#CategoricalClassification-614"><span class="linenos">614</span></a>                    <span class="n">sample_indices_slice</span> <span class="o">=</span> <span class="n">closest_sample_indices</span><span class="p">[:</span><span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span>
+</span><span id="CategoricalClassification-615"><a href="#CategoricalClassification-615"><span class="linenos">615</span></a>                    <span class="n">overflow_indices_slice</span> <span class="o">=</span> <span class="n">overflow_indices_sorted</span><span class="p">[:</span><span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span>
+</span><span id="CategoricalClassification-616"><a href="#CategoricalClassification-616"><span class="linenos">616</span></a>
+</span><span id="CategoricalClassification-617"><a href="#CategoricalClassification-617"><span class="linenos">617</span></a>                    <span class="n">cluster_labels</span><span class="p">[</span><span class="n">overflow_indices_slice</span><span class="p">]</span> <span class="o">=</span> <span class="n">i</span>
+</span><span id="CategoricalClassification-618"><a href="#CategoricalClassification-618"><span class="linenos">618</span></a>
+</span><span id="CategoricalClassification-619"><a href="#CategoricalClassification-619"><span class="linenos">619</span></a>                    <span class="n">overflow_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">delete</span><span class="p">(</span><span class="n">overflow_samples</span><span class="p">,</span> <span class="n">sample_indices_slice</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification-620"><a href="#CategoricalClassification-620"><span class="linenos">620</span></a>                    <span class="n">overflow_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">delete</span><span class="p">(</span><span class="n">overflow_indices</span><span class="p">,</span> <span class="n">sample_indices_slice</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification-621"><a href="#CategoricalClassification-621"><span class="linenos">621</span></a>
+</span><span id="CategoricalClassification-622"><a href="#CategoricalClassification-622"><span class="linenos">622</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">cluster_labels</span><span class="p">)</span>
+</span><span id="CategoricalClassification-623"><a href="#CategoricalClassification-623"><span class="linenos">623</span></a>
+</span><span id="CategoricalClassification-624"><a href="#CategoricalClassification-624"><span class="linenos">624</span></a>    <span class="k">def</span> <span class="nf">generate_noise</span><span class="p">(</span>
+</span><span id="CategoricalClassification-625"><a href="#CategoricalClassification-625"><span class="linenos">625</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-626"><a href="#CategoricalClassification-626"><span class="linenos">626</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-627"><a href="#CategoricalClassification-627"><span class="linenos">627</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-628"><a href="#CategoricalClassification-628"><span class="linenos">628</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.2</span><span class="p">,</span>
+</span><span id="CategoricalClassification-629"><a href="#CategoricalClassification-629"><span class="linenos">629</span></a>        <span class="nb">type</span><span class="p">:</span> <span class="n">Literal</span> <span class="o">=</span> <span class="s1">&#39;categorical&#39;</span><span class="p">,</span>
+</span><span id="CategoricalClassification-630"><a href="#CategoricalClassification-630"><span class="linenos">630</span></a>        <span class="n">missing_val</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;-inf&#39;</span><span class="p">),</span>
+</span><span id="CategoricalClassification-631"><a href="#CategoricalClassification-631"><span class="linenos">631</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-632"><a href="#CategoricalClassification-632"><span class="linenos">632</span></a>
+</span><span id="CategoricalClassification-633"><a href="#CategoricalClassification-633"><span class="linenos">633</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-634"><a href="#CategoricalClassification-634"><span class="linenos">634</span></a><span class="sd">        Simulates noise on given dataset X</span>
+</span><span id="CategoricalClassification-635"><a href="#CategoricalClassification-635"><span class="linenos">635</span></a><span class="sd">        :param X: dataset to apply noise to</span>
+</span><span id="CategoricalClassification-636"><a href="#CategoricalClassification-636"><span class="linenos">636</span></a><span class="sd">        :param y: required target labels for categorical noise generation</span>
+</span><span id="CategoricalClassification-637"><a href="#CategoricalClassification-637"><span class="linenos">637</span></a><span class="sd">        :param p: amount of noise to apply. Defaults to 0.2</span>
+</span><span id="CategoricalClassification-638"><a href="#CategoricalClassification-638"><span class="linenos">638</span></a><span class="sd">        :param type: type of noise to apply, either categorical or missing</span>
+</span><span id="CategoricalClassification-639"><a href="#CategoricalClassification-639"><span class="linenos">639</span></a><span class="sd">        :param missing_val: value to simulate missing values. Defaults to float(&#39;-inf&#39;)</span>
+</span><span id="CategoricalClassification-640"><a href="#CategoricalClassification-640"><span class="linenos">640</span></a><span class="sd">        :return: X with noise applied</span>
+</span><span id="CategoricalClassification-641"><a href="#CategoricalClassification-641"><span class="linenos">641</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-642"><a href="#CategoricalClassification-642"><span class="linenos">642</span></a>
+</span><span id="CategoricalClassification-643"><a href="#CategoricalClassification-643"><span class="linenos">643</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="CategoricalClassification-644"><a href="#CategoricalClassification-644"><span class="linenos">644</span></a>            <span class="s1">&#39;type&#39;</span><span class="p">:</span> <span class="nb">type</span><span class="p">,</span>
+</span><span id="CategoricalClassification-645"><a href="#CategoricalClassification-645"><span class="linenos">645</span></a>            <span class="s1">&#39;amount&#39;</span><span class="p">:</span> <span class="n">p</span><span class="p">,</span>
+</span><span id="CategoricalClassification-646"><a href="#CategoricalClassification-646"><span class="linenos">646</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification-647"><a href="#CategoricalClassification-647"><span class="linenos">647</span></a>
+</span><span id="CategoricalClassification-648"><a href="#CategoricalClassification-648"><span class="linenos">648</span></a>        <span class="k">if</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;categorical&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification-649"><a href="#CategoricalClassification-649"><span class="linenos">649</span></a>            <span class="n">label_values</span><span class="p">,</span> <span class="n">label_count</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="CategoricalClassification-650"><a href="#CategoricalClassification-650"><span class="linenos">650</span></a>            <span class="n">n_labels</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">label_values</span><span class="p">)</span>
+</span><span id="CategoricalClassification-651"><a href="#CategoricalClassification-651"><span class="linenos">651</span></a>
+</span><span id="CategoricalClassification-652"><a href="#CategoricalClassification-652"><span class="linenos">652</span></a>            <span class="n">inds</span> <span class="o">=</span> <span class="n">y</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
+</span><span id="CategoricalClassification-653"><a href="#CategoricalClassification-653"><span class="linenos">653</span></a>            <span class="n">y_sort</span> <span class="o">=</span> <span class="n">y</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
+</span><span id="CategoricalClassification-654"><a href="#CategoricalClassification-654"><span class="linenos">654</span></a>            <span class="n">X_sort</span> <span class="o">=</span> <span class="n">X</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
+</span><span id="CategoricalClassification-655"><a href="#CategoricalClassification-655"><span class="linenos">655</span></a>
+</span><span id="CategoricalClassification-656"><a href="#CategoricalClassification-656"><span class="linenos">656</span></a>            <span class="n">Xs_T</span> <span class="o">=</span> <span class="n">X_sort</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-657"><a href="#CategoricalClassification-657"><span class="linenos">657</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="CategoricalClassification-658"><a href="#CategoricalClassification-658"><span class="linenos">658</span></a>            <span class="n">n_flip</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
+</span><span id="CategoricalClassification-659"><a href="#CategoricalClassification-659"><span class="linenos">659</span></a>
+</span><span id="CategoricalClassification-660"><a href="#CategoricalClassification-660"><span class="linenos">660</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xs_T</span><span class="p">:</span>
+</span><span id="CategoricalClassification-661"><a href="#CategoricalClassification-661"><span class="linenos">661</span></a>                <span class="n">unique_per_label</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="CategoricalClassification-662"><a href="#CategoricalClassification-662"><span class="linenos">662</span></a>
+</span><span id="CategoricalClassification-663"><a href="#CategoricalClassification-663"><span class="linenos">663</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_labels</span><span class="p">):</span>
+</span><span id="CategoricalClassification-664"><a href="#CategoricalClassification-664"><span class="linenos">664</span></a>                    <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification-665"><a href="#CategoricalClassification-665"><span class="linenos">665</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]])</span>
+</span><span id="CategoricalClassification-666"><a href="#CategoricalClassification-666"><span class="linenos">666</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
+</span><span id="CategoricalClassification-667"><a href="#CategoricalClassification-667"><span class="linenos">667</span></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-668"><a href="#CategoricalClassification-668"><span class="linenos">668</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">-</span> <span class="mi">1</span><span class="p">])</span>
+</span><span id="CategoricalClassification-669"><a href="#CategoricalClassification-669"><span class="linenos">669</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
+</span><span id="CategoricalClassification-670"><a href="#CategoricalClassification-670"><span class="linenos">670</span></a>
+</span><span id="CategoricalClassification-671"><a href="#CategoricalClassification-671"><span class="linenos">671</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_flip</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="CategoricalClassification-672"><a href="#CategoricalClassification-672"><span class="linenos">672</span></a>
+</span><span id="CategoricalClassification-673"><a href="#CategoricalClassification-673"><span class="linenos">673</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
+</span><span id="CategoricalClassification-674"><a href="#CategoricalClassification-674"><span class="linenos">674</span></a>                    <span class="n">current_label</span> <span class="o">=</span> <span class="n">y_sort</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span>
+</span><span id="CategoricalClassification-675"><a href="#CategoricalClassification-675"><span class="linenos">675</span></a>                    <span class="n">possible_labels</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">label_values</span> <span class="o">!=</span> <span class="n">current_label</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="CategoricalClassification-676"><a href="#CategoricalClassification-676"><span class="linenos">676</span></a>
+</span><span id="CategoricalClassification-677"><a href="#CategoricalClassification-677"><span class="linenos">677</span></a>                    <span class="c1"># find all unique values from labels != current label</span>
+</span><span id="CategoricalClassification-678"><a href="#CategoricalClassification-678"><span class="linenos">678</span></a>                    <span class="n">values</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span>
+</span><span id="CategoricalClassification-679"><a href="#CategoricalClassification-679"><span class="linenos">679</span></a>                    <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">possible_labels</span><span class="p">:</span>
+</span><span id="CategoricalClassification-680"><a href="#CategoricalClassification-680"><span class="linenos">680</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">values</span><span class="o">.</span><span class="n">union</span><span class="p">(</span><span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">])</span>
+</span><span id="CategoricalClassification-681"><a href="#CategoricalClassification-681"><span class="linenos">681</span></a>
+</span><span id="CategoricalClassification-682"><a href="#CategoricalClassification-682"><span class="linenos">682</span></a>                    <span class="c1"># remove any overlapping values, ensuring replacement values are unique &amp; from a target label !=</span>
+</span><span id="CategoricalClassification-683"><a href="#CategoricalClassification-683"><span class="linenos">683</span></a>                    <span class="c1"># current label</span>
+</span><span id="CategoricalClassification-684"><a href="#CategoricalClassification-684"><span class="linenos">684</span></a>                    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">current_label</span><span class="p">]</span> <span class="o">&amp;</span> <span class="n">values</span><span class="p">:</span>
+</span><span id="CategoricalClassification-685"><a href="#CategoricalClassification-685"><span class="linenos">685</span></a>                        <span class="n">values</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">val</span><span class="p">)</span>
+</span><span id="CategoricalClassification-686"><a href="#CategoricalClassification-686"><span class="linenos">686</span></a>
+</span><span id="CategoricalClassification-687"><a href="#CategoricalClassification-687"><span class="linenos">687</span></a>                    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">values</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification-688"><a href="#CategoricalClassification-688"><span class="linenos">688</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
+</span><span id="CategoricalClassification-689"><a href="#CategoricalClassification-689"><span class="linenos">689</span></a>
+</span><span id="CategoricalClassification-690"><a href="#CategoricalClassification-690"><span class="linenos">690</span></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-691"><a href="#CategoricalClassification-691"><span class="linenos">691</span></a>                        <span class="n">key</span> <span class="o">=</span> <span class="n">possible_labels</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">possible_labels</span><span class="p">))]</span>
+</span><span id="CategoricalClassification-692"><a href="#CategoricalClassification-692"><span class="linenos">692</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
+</span><span id="CategoricalClassification-693"><a href="#CategoricalClassification-693"><span class="linenos">693</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
+</span><span id="CategoricalClassification-694"><a href="#CategoricalClassification-694"><span class="linenos">694</span></a>
+</span><span id="CategoricalClassification-695"><a href="#CategoricalClassification-695"><span class="linenos">695</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">val</span>
+</span><span id="CategoricalClassification-696"><a href="#CategoricalClassification-696"><span class="linenos">696</span></a>
+</span><span id="CategoricalClassification-697"><a href="#CategoricalClassification-697"><span class="linenos">697</span></a>            <span class="n">rev_ind</span> <span class="o">=</span> <span class="n">inds</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
+</span><span id="CategoricalClassification-698"><a href="#CategoricalClassification-698"><span class="linenos">698</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-699"><a href="#CategoricalClassification-699"><span class="linenos">699</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">X_noise</span><span class="p">[</span><span class="n">rev_ind</span><span class="p">]</span>
+</span><span id="CategoricalClassification-700"><a href="#CategoricalClassification-700"><span class="linenos">700</span></a>
+</span><span id="CategoricalClassification-701"><a href="#CategoricalClassification-701"><span class="linenos">701</span></a>            <span class="k">return</span> <span class="n">X_noise</span>
+</span><span id="CategoricalClassification-702"><a href="#CategoricalClassification-702"><span class="linenos">702</span></a>
+</span><span id="CategoricalClassification-703"><a href="#CategoricalClassification-703"><span class="linenos">703</span></a>        <span class="k">elif</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;missing&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification-704"><a href="#CategoricalClassification-704"><span class="linenos">704</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification-705"><a href="#CategoricalClassification-705"><span class="linenos">705</span></a>            <span class="n">Xn_T</span> <span class="o">=</span> <span class="n">X_noise</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-706"><a href="#CategoricalClassification-706"><span class="linenos">706</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="CategoricalClassification-707"><a href="#CategoricalClassification-707"><span class="linenos">707</span></a>            <span class="n">n_missing</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
+</span><span id="CategoricalClassification-708"><a href="#CategoricalClassification-708"><span class="linenos">708</span></a>            <span class="c1">#print(&quot;n to delete:&quot;, n_missing)</span>
+</span><span id="CategoricalClassification-709"><a href="#CategoricalClassification-709"><span class="linenos">709</span></a>
+</span><span id="CategoricalClassification-710"><a href="#CategoricalClassification-710"><span class="linenos">710</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xn_T</span><span class="p">:</span>
+</span><span id="CategoricalClassification-711"><a href="#CategoricalClassification-711"><span class="linenos">711</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_missing</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="CategoricalClassification-712"><a href="#CategoricalClassification-712"><span class="linenos">712</span></a>
+</span><span id="CategoricalClassification-713"><a href="#CategoricalClassification-713"><span class="linenos">713</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
+</span><span id="CategoricalClassification-714"><a href="#CategoricalClassification-714"><span class="linenos">714</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">missing_val</span>
+</span><span id="CategoricalClassification-715"><a href="#CategoricalClassification-715"><span class="linenos">715</span></a>
+</span><span id="CategoricalClassification-716"><a href="#CategoricalClassification-716"><span class="linenos">716</span></a>            <span class="k">return</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-717"><a href="#CategoricalClassification-717"><span class="linenos">717</span></a>
+</span><span id="CategoricalClassification-718"><a href="#CategoricalClassification-718"><span class="linenos">718</span></a>    <span class="k">def</span> <span class="nf">downsample_dataset</span><span class="p">(</span>
+</span><span id="CategoricalClassification-719"><a href="#CategoricalClassification-719"><span class="linenos">719</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-720"><a href="#CategoricalClassification-720"><span class="linenos">720</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-721"><a href="#CategoricalClassification-721"><span class="linenos">721</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-722"><a href="#CategoricalClassification-722"><span class="linenos">722</span></a>        <span class="n">N</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification-723"><a href="#CategoricalClassification-723"><span class="linenos">723</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
+</span><span id="CategoricalClassification-724"><a href="#CategoricalClassification-724"><span class="linenos">724</span></a>        <span class="n">reshuffle</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-725"><a href="#CategoricalClassification-725"><span class="linenos">725</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">]:</span>
+</span><span id="CategoricalClassification-726"><a href="#CategoricalClassification-726"><span class="linenos">726</span></a>
+</span><span id="CategoricalClassification-727"><a href="#CategoricalClassification-727"><span class="linenos">727</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-728"><a href="#CategoricalClassification-728"><span class="linenos">728</span></a><span class="sd">        Downsamples dataset X according to N or the number of samples in minority class, resulting in a balanced dataset.</span>
+</span><span id="CategoricalClassification-729"><a href="#CategoricalClassification-729"><span class="linenos">729</span></a><span class="sd">        :param X: Dataset to downsample</span>
+</span><span id="CategoricalClassification-730"><a href="#CategoricalClassification-730"><span class="linenos">730</span></a><span class="sd">        :param y: Labels corresponding to X</span>
+</span><span id="CategoricalClassification-731"><a href="#CategoricalClassification-731"><span class="linenos">731</span></a><span class="sd">        :param N: Optional number of samples per class to downsample to</span>
+</span><span id="CategoricalClassification-732"><a href="#CategoricalClassification-732"><span class="linenos">732</span></a><span class="sd">        :param seed: Seed for random state of resample function</span>
+</span><span id="CategoricalClassification-733"><a href="#CategoricalClassification-733"><span class="linenos">733</span></a><span class="sd">        :param reshuffle: Reshuffle the dataset after downsampling</span>
+</span><span id="CategoricalClassification-734"><a href="#CategoricalClassification-734"><span class="linenos">734</span></a><span class="sd">        :return: Balanced X and y after downsampling</span>
+</span><span id="CategoricalClassification-735"><a href="#CategoricalClassification-735"><span class="linenos">735</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-736"><a href="#CategoricalClassification-736"><span class="linenos">736</span></a>
+</span><span id="CategoricalClassification-737"><a href="#CategoricalClassification-737"><span class="linenos">737</span></a>        <span class="n">original_shape</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification-738"><a href="#CategoricalClassification-738"><span class="linenos">738</span></a>
+</span><span id="CategoricalClassification-739"><a href="#CategoricalClassification-739"><span class="linenos">739</span></a>        <span class="n">values</span><span class="p">,</span> <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="CategoricalClassification-740"><a href="#CategoricalClassification-740"><span class="linenos">740</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification-741"><a href="#CategoricalClassification-741"><span class="linenos">741</span></a>            <span class="n">N</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">)</span>
+</span><span id="CategoricalClassification-742"><a href="#CategoricalClassification-742"><span class="linenos">742</span></a>
+</span><span id="CategoricalClassification-743"><a href="#CategoricalClassification-743"><span class="linenos">743</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="o">&gt;</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">):</span>
+</span><span id="CategoricalClassification-744"><a href="#CategoricalClassification-744"><span class="linenos">744</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;N must be equal to or less than the number of samples in minority class&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-745"><a href="#CategoricalClassification-745"><span class="linenos">745</span></a>
+</span><span id="CategoricalClassification-746"><a href="#CategoricalClassification-746"><span class="linenos">746</span></a>        <span class="n">X_arrays_list</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification-747"><a href="#CategoricalClassification-747"><span class="linenos">747</span></a>        <span class="n">y_downsampled</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification-748"><a href="#CategoricalClassification-748"><span class="linenos">748</span></a>        <span class="k">for</span> <span class="n">label</span> <span class="ow">in</span> <span class="n">values</span><span class="p">:</span>
+</span><span id="CategoricalClassification-749"><a href="#CategoricalClassification-749"><span class="linenos">749</span></a>            <span class="n">X_label</span> <span class="o">=</span> <span class="p">[</span><span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">y</span><span class="p">))</span> <span class="k">if</span> <span class="n">y</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">==</span> <span class="n">label</span><span class="p">]</span>
+</span><span id="CategoricalClassification-750"><a href="#CategoricalClassification-750"><span class="linenos">750</span></a>            <span class="n">X_label_downsample</span> <span class="o">=</span> <span class="n">resample</span><span class="p">(</span>
+</span><span id="CategoricalClassification-751"><a href="#CategoricalClassification-751"><span class="linenos">751</span></a>                <span class="n">X_label</span><span class="p">,</span>
+</span><span id="CategoricalClassification-752"><a href="#CategoricalClassification-752"><span class="linenos">752</span></a>                <span class="n">replace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+</span><span id="CategoricalClassification-753"><a href="#CategoricalClassification-753"><span class="linenos">753</span></a>                <span class="n">n_samples</span><span class="o">=</span><span class="n">N</span><span class="p">,</span>
+</span><span id="CategoricalClassification-754"><a href="#CategoricalClassification-754"><span class="linenos">754</span></a>                <span class="n">random_state</span><span class="o">=</span><span class="n">seed</span><span class="p">,</span>
+</span><span id="CategoricalClassification-755"><a href="#CategoricalClassification-755"><span class="linenos">755</span></a>            <span class="p">)</span>
+</span><span id="CategoricalClassification-756"><a href="#CategoricalClassification-756"><span class="linenos">756</span></a>            <span class="n">X_arrays_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">X_label_downsample</span><span class="p">)</span>
+</span><span id="CategoricalClassification-757"><a href="#CategoricalClassification-757"><span class="linenos">757</span></a>            <span class="n">ys</span> <span class="o">=</span> <span class="p">[</span><span class="n">label</span><span class="p">]</span> <span class="o">*</span> <span class="n">N</span>
+</span><span id="CategoricalClassification-758"><a href="#CategoricalClassification-758"><span class="linenos">758</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">y_downsampled</span><span class="p">,</span> <span class="n">ys</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification-759"><a href="#CategoricalClassification-759"><span class="linenos">759</span></a>
+</span><span id="CategoricalClassification-760"><a href="#CategoricalClassification-760"><span class="linenos">760</span></a>        <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">X_arrays_list</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification-761"><a href="#CategoricalClassification-761"><span class="linenos">761</span></a>
+</span><span id="CategoricalClassification-762"><a href="#CategoricalClassification-762"><span class="linenos">762</span></a>        <span class="k">if</span> <span class="n">reshuffle</span><span class="p">:</span>
+</span><span id="CategoricalClassification-763"><a href="#CategoricalClassification-763"><span class="linenos">763</span></a>            <span class="n">indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X_downsampled</span><span class="p">))</span>
+</span><span id="CategoricalClassification-764"><a href="#CategoricalClassification-764"><span class="linenos">764</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">indices</span><span class="p">)</span>
+</span><span id="CategoricalClassification-765"><a href="#CategoricalClassification-765"><span class="linenos">765</span></a>            <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification-766"><a href="#CategoricalClassification-766"><span class="linenos">766</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">y_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification-767"><a href="#CategoricalClassification-767"><span class="linenos">767</span></a>
+</span><span id="CategoricalClassification-768"><a href="#CategoricalClassification-768"><span class="linenos">768</span></a>        <span class="n">downsampled_shape</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification-769"><a href="#CategoricalClassification-769"><span class="linenos">769</span></a>
+</span><span id="CategoricalClassification-770"><a href="#CategoricalClassification-770"><span class="linenos">770</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="CategoricalClassification-771"><a href="#CategoricalClassification-771"><span class="linenos">771</span></a>            <span class="s1">&#39;downsampling&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="CategoricalClassification-772"><a href="#CategoricalClassification-772"><span class="linenos">772</span></a>                <span class="s1">&#39;original_shape&#39;</span><span class="p">:</span> <span class="n">original_shape</span><span class="p">,</span>
+</span><span id="CategoricalClassification-773"><a href="#CategoricalClassification-773"><span class="linenos">773</span></a>                <span class="s1">&#39;downsampled_shape&#39;</span><span class="p">:</span> <span class="n">downsampled_shape</span><span class="p">,</span>
+</span><span id="CategoricalClassification-774"><a href="#CategoricalClassification-774"><span class="linenos">774</span></a>            <span class="p">},</span>
+</span><span id="CategoricalClassification-775"><a href="#CategoricalClassification-775"><span class="linenos">775</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification-776"><a href="#CategoricalClassification-776"><span class="linenos">776</span></a>
+</span><span id="CategoricalClassification-777"><a href="#CategoricalClassification-777"><span class="linenos">777</span></a>        <span class="k">return</span> <span class="n">X_downsampled</span><span class="p">,</span> <span class="n">y_downsampled</span>
+</span><span id="CategoricalClassification-778"><a href="#CategoricalClassification-778"><span class="linenos">778</span></a>
+</span><span id="CategoricalClassification-779"><a href="#CategoricalClassification-779"><span class="linenos">779</span></a>    <span class="k">def</span> <span class="nf">print_dataset</span><span class="p">(</span>
+</span><span id="CategoricalClassification-780"><a href="#CategoricalClassification-780"><span class="linenos">780</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-781"><a href="#CategoricalClassification-781"><span class="linenos">781</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-782"><a href="#CategoricalClassification-782"><span class="linenos">782</span></a>        <span class="n">y</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-783"><a href="#CategoricalClassification-783"><span class="linenos">783</span></a>    <span class="p">):</span>
+</span><span id="CategoricalClassification-784"><a href="#CategoricalClassification-784"><span class="linenos">784</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-785"><a href="#CategoricalClassification-785"><span class="linenos">785</span></a><span class="sd">        Prints given dataset</span>
+</span><span id="CategoricalClassification-786"><a href="#CategoricalClassification-786"><span class="linenos">786</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification-787"><a href="#CategoricalClassification-787"><span class="linenos">787</span></a><span class="sd">        :param y: labels</span>
+</span><span id="CategoricalClassification-788"><a href="#CategoricalClassification-788"><span class="linenos">788</span></a><span class="sd">        :return:</span>
+</span><span id="CategoricalClassification-789"><a href="#CategoricalClassification-789"><span class="linenos">789</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-790"><a href="#CategoricalClassification-790"><span class="linenos">790</span></a>
+</span><span id="CategoricalClassification-791"><a href="#CategoricalClassification-791"><span class="linenos">791</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification-792"><a href="#CategoricalClassification-792"><span class="linenos">792</span></a>        <span class="n">n</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="CategoricalClassification-793"><a href="#CategoricalClassification-793"><span class="linenos">793</span></a>        <span class="k">for</span> <span class="n">arr</span> <span class="ow">in</span> <span class="n">X</span><span class="p">:</span>
+</span><span id="CategoricalClassification-794"><a href="#CategoricalClassification-794"><span class="linenos">794</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;[&#39;</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-795"><a href="#CategoricalClassification-795"><span class="linenos">795</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
+</span><span id="CategoricalClassification-796"><a href="#CategoricalClassification-796"><span class="linenos">796</span></a>                <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="n">n_features</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="CategoricalClassification-797"><a href="#CategoricalClassification-797"><span class="linenos">797</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-798"><a href="#CategoricalClassification-798"><span class="linenos">798</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-799"><a href="#CategoricalClassification-799"><span class="linenos">799</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;, &#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-800"><a href="#CategoricalClassification-800"><span class="linenos">800</span></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;], Label: </span><span class="si">{</span><span class="n">y</span><span class="p">[</span><span class="n">n</span><span class="p">]</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-801"><a href="#CategoricalClassification-801"><span class="linenos">801</span></a>            <span class="n">n</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification-802"><a href="#CategoricalClassification-802"><span class="linenos">802</span></a>
+</span><span id="CategoricalClassification-803"><a href="#CategoricalClassification-803"><span class="linenos">803</span></a>    <span class="k">def</span> <span class="nf">summarize</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="CategoricalClassification-804"><a href="#CategoricalClassification-804"><span class="linenos">804</span></a>
+</span><span id="CategoricalClassification-805"><a href="#CategoricalClassification-805"><span class="linenos">805</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of features: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;general&#39;</span><span class="p">][</span><span class="s1">&#39;n_features&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-806"><a href="#CategoricalClassification-806"><span class="linenos">806</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of generated samples: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;general&#39;</span><span class="p">][</span><span class="s1">&#39;n_samples&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-807"><a href="#CategoricalClassification-807"><span class="linenos">807</span></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">]:</span>
+</span><span id="CategoricalClassification-808"><a href="#CategoricalClassification-808"><span class="linenos">808</span></a>            <span class="nb">print</span><span class="p">(</span>
+</span><span id="CategoricalClassification-809"><a href="#CategoricalClassification-809"><span class="linenos">809</span></a>                <span class="sa">f</span><span class="s2">&quot;Dataset downsampled from shape </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">][</span><span class="s1">&#39;original_shape&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">, to shape </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">][</span><span class="s1">&#39;downsampled_shape&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="CategoricalClassification-810"><a href="#CategoricalClassification-810"><span class="linenos">810</span></a>            <span class="p">)</span>
+</span><span id="CategoricalClassification-811"><a href="#CategoricalClassification-811"><span class="linenos">811</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of classes: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;labels&#39;</span><span class="p">][</span><span class="s1">&#39;n_class&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-812"><a href="#CategoricalClassification-812"><span class="linenos">812</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Class relation: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;labels&#39;</span><span class="p">][</span><span class="s1">&#39;class_relation&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-813"><a href="#CategoricalClassification-813"><span class="linenos">813</span></a>
+</span><span id="CategoricalClassification-814"><a href="#CategoricalClassification-814"><span class="linenos">814</span></a>        <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-815"><a href="#CategoricalClassification-815"><span class="linenos">815</span></a>
+</span><span id="CategoricalClassification-816"><a href="#CategoricalClassification-816"><span class="linenos">816</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification-817"><a href="#CategoricalClassification-817"><span class="linenos">817</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Combinations:&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-818"><a href="#CategoricalClassification-818"><span class="linenos">818</span></a>            <span class="k">for</span> <span class="n">comb</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">]:</span>
+</span><span id="CategoricalClassification-819"><a href="#CategoricalClassification-819"><span class="linenos">819</span></a>                <span class="nb">print</span><span class="p">(</span>
+</span><span id="CategoricalClassification-820"><a href="#CategoricalClassification-820"><span class="linenos">820</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are in </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;combination_type&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> combination, result in </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;combination_ix&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="CategoricalClassification-821"><a href="#CategoricalClassification-821"><span class="linenos">821</span></a>                <span class="p">)</span>
+</span><span id="CategoricalClassification-822"><a href="#CategoricalClassification-822"><span class="linenos">822</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-823"><a href="#CategoricalClassification-823"><span class="linenos">823</span></a>
+</span><span id="CategoricalClassification-824"><a href="#CategoricalClassification-824"><span class="linenos">824</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification-825"><a href="#CategoricalClassification-825"><span class="linenos">825</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Correlations:&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-826"><a href="#CategoricalClassification-826"><span class="linenos">826</span></a>            <span class="k">for</span> <span class="n">corr</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">]:</span>
+</span><span id="CategoricalClassification-827"><a href="#CategoricalClassification-827"><span class="linenos">827</span></a>                <span class="nb">print</span><span class="p">(</span>
+</span><span id="CategoricalClassification-828"><a href="#CategoricalClassification-828"><span class="linenos">828</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are correlated to </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;correlated_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> with a factor of </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;correlation_factor&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="CategoricalClassification-829"><a href="#CategoricalClassification-829"><span class="linenos">829</span></a>                <span class="p">)</span>
+</span><span id="CategoricalClassification-830"><a href="#CategoricalClassification-830"><span class="linenos">830</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-831"><a href="#CategoricalClassification-831"><span class="linenos">831</span></a>
+</span><span id="CategoricalClassification-832"><a href="#CategoricalClassification-832"><span class="linenos">832</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification-833"><a href="#CategoricalClassification-833"><span class="linenos">833</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Duplicates:&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-834"><a href="#CategoricalClassification-834"><span class="linenos">834</span></a>            <span class="k">for</span> <span class="n">dup</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">]:</span>
+</span><span id="CategoricalClassification-835"><a href="#CategoricalClassification-835"><span class="linenos">835</span></a>                <span class="nb">print</span><span class="p">(</span>
+</span><span id="CategoricalClassification-836"><a href="#CategoricalClassification-836"><span class="linenos">836</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">dup</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are duplicated, duplicate indexes are </span><span class="si">{</span><span class="n">dup</span><span class="p">[</span><span class="s1">&#39;duplicate_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="CategoricalClassification-837"><a href="#CategoricalClassification-837"><span class="linenos">837</span></a>                <span class="p">)</span>
+</span><span id="CategoricalClassification-838"><a href="#CategoricalClassification-838"><span class="linenos">838</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-839"><a href="#CategoricalClassification-839"><span class="linenos">839</span></a>
+</span><span id="CategoricalClassification-840"><a href="#CategoricalClassification-840"><span class="linenos">840</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification-841"><a href="#CategoricalClassification-841"><span class="linenos">841</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Simulated noise:&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-842"><a href="#CategoricalClassification-842"><span class="linenos">842</span></a>            <span class="k">for</span> <span class="n">noise</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">]:</span>
+</span><span id="CategoricalClassification-843"><a href="#CategoricalClassification-843"><span class="linenos">843</span></a>                <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Simulated </span><span class="si">{</span><span class="n">noise</span><span class="p">[</span><span class="s1">&#39;type&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> noise, amount of </span><span class="si">{</span><span class="n">noise</span><span class="p">[</span><span class="s1">&#39;noise_amount&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-844"><a href="#CategoricalClassification-844"><span class="linenos">844</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-845"><a href="#CategoricalClassification-845"><span class="linenos">845</span></a>
+</span><span id="CategoricalClassification-846"><a href="#CategoricalClassification-846"><span class="linenos">846</span></a>        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\n</span><span class="s2">For more information on dataset structure, print cc.dataset_info[&#39;general&#39;][&#39;structure&#39;]&quot;</span><span class="p">)</span>
+</span></pre></div>
+
+
+    
+
+                            <div id="CategoricalClassification.dataset_info" class="classattr">
+                                <div class="attr variable">
+            <span class="name">dataset_info</span>
+
+        
+    </div>
+    <a class="headerlink" href="#CategoricalClassification.dataset_info"></a>
+    
+    
+
+                            </div>
+                            <div id="CategoricalClassification.generate_data" class="classattr">
+                                        <input id="CategoricalClassification.generate_data-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">generate_data</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">n_features</span><span class="p">:</span> <span class="nb">int</span>,</span><span class="param">	<span class="n">n_samples</span><span class="p">:</span> <span class="nb">int</span>,</span><span class="param">	<span class="n">cardinality</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span>,</span><span class="param">	<span class="n">structure</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">list</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]],</span> <span class="n">NoneType</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span>,</span><span class="param">	<span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span>,</span><span class="param">	<span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span>,</span><span class="param">	<span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span>,</span><span class="param">	<span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span></span><span class="return-annotation">) -> <span class="n">numpy</span><span class="o">.</span><span class="n">ndarray</span>:</span></span>
+
+                <label class="view-source-button" for="CategoricalClassification.generate_data-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#CategoricalClassification.generate_data"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_data-33"><a href="#CategoricalClassification.generate_data-33"><span class="linenos"> 33</span></a>    <span class="k">def</span> <span class="nf">generate_data</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_data-34"><a href="#CategoricalClassification.generate_data-34"><span class="linenos"> 34</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-35"><a href="#CategoricalClassification.generate_data-35"><span class="linenos"> 35</span></a>        <span class="n">n_features</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-36"><a href="#CategoricalClassification.generate_data-36"><span class="linenos"> 36</span></a>        <span class="n">n_samples</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-37"><a href="#CategoricalClassification.generate_data-37"><span class="linenos"> 37</span></a>        <span class="n">cardinality</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-38"><a href="#CategoricalClassification.generate_data-38"><span class="linenos"> 38</span></a>        <span class="n">structure</span><span class="p">:</span> <span class="nb">list</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-39"><a href="#CategoricalClassification.generate_data-39"><span class="linenos"> 39</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-40"><a href="#CategoricalClassification.generate_data-40"><span class="linenos"> 40</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-41"><a href="#CategoricalClassification.generate_data-41"><span class="linenos"> 41</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-42"><a href="#CategoricalClassification.generate_data-42"><span class="linenos"> 42</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-43"><a href="#CategoricalClassification.generate_data-43"><span class="linenos"> 43</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-44"><a href="#CategoricalClassification.generate_data-44"><span class="linenos"> 44</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-45"><a href="#CategoricalClassification.generate_data-45"><span class="linenos"> 45</span></a>
+</span><span id="CategoricalClassification.generate_data-46"><a href="#CategoricalClassification.generate_data-46"><span class="linenos"> 46</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_data-47"><a href="#CategoricalClassification.generate_data-47"><span class="linenos"> 47</span></a><span class="sd">        Generates dataset based on given parameters</span>
+</span><span id="CategoricalClassification.generate_data-48"><a href="#CategoricalClassification.generate_data-48"><span class="linenos"> 48</span></a><span class="sd">        :param n_features: number of generated features</span>
+</span><span id="CategoricalClassification.generate_data-49"><a href="#CategoricalClassification.generate_data-49"><span class="linenos"> 49</span></a><span class="sd">        :param n_samples: number of generated samples</span>
+</span><span id="CategoricalClassification.generate_data-50"><a href="#CategoricalClassification.generate_data-50"><span class="linenos"> 50</span></a><span class="sd">        :param cardinality: default cardinality of the dataset</span>
+</span><span id="CategoricalClassification.generate_data-51"><a href="#CategoricalClassification.generate_data-51"><span class="linenos"> 51</span></a><span class="sd">        :param structure: structure of the dataset</span>
+</span><span id="CategoricalClassification.generate_data-52"><a href="#CategoricalClassification.generate_data-52"><span class="linenos"> 52</span></a><span class="sd">        :param ensure_rep: flag, ensures all given values represented</span>
+</span><span id="CategoricalClassification.generate_data-53"><a href="#CategoricalClassification.generate_data-53"><span class="linenos"> 53</span></a><span class="sd">        :param random_values: flag, enables random (integer) feature values from set [low, high]</span>
+</span><span id="CategoricalClassification.generate_data-54"><a href="#CategoricalClassification.generate_data-54"><span class="linenos"> 54</span></a><span class="sd">        :param low: sets lower bound of random feature values</span>
+</span><span id="CategoricalClassification.generate_data-55"><a href="#CategoricalClassification.generate_data-55"><span class="linenos"> 55</span></a><span class="sd">        :param high: sets high bound of random feature values</span>
+</span><span id="CategoricalClassification.generate_data-56"><a href="#CategoricalClassification.generate_data-56"><span class="linenos"> 56</span></a><span class="sd">        :param seed: sets seed of numpy random</span>
+</span><span id="CategoricalClassification.generate_data-57"><a href="#CategoricalClassification.generate_data-57"><span class="linenos"> 57</span></a><span class="sd">        :return: X, 2D dataset</span>
+</span><span id="CategoricalClassification.generate_data-58"><a href="#CategoricalClassification.generate_data-58"><span class="linenos"> 58</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_data-59"><a href="#CategoricalClassification.generate_data-59"><span class="linenos"> 59</span></a>
+</span><span id="CategoricalClassification.generate_data-60"><a href="#CategoricalClassification.generate_data-60"><span class="linenos"> 60</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="CategoricalClassification.generate_data-61"><a href="#CategoricalClassification.generate_data-61"><span class="linenos"> 61</span></a>            <span class="s1">&#39;general&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="CategoricalClassification.generate_data-62"><a href="#CategoricalClassification.generate_data-62"><span class="linenos"> 62</span></a>                <span class="s1">&#39;n_features&#39;</span><span class="p">:</span> <span class="n">n_features</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-63"><a href="#CategoricalClassification.generate_data-63"><span class="linenos"> 63</span></a>                <span class="s1">&#39;n_samples&#39;</span><span class="p">:</span> <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-64"><a href="#CategoricalClassification.generate_data-64"><span class="linenos"> 64</span></a>                <span class="s1">&#39;cardinality&#39;</span><span class="p">:</span> <span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-65"><a href="#CategoricalClassification.generate_data-65"><span class="linenos"> 65</span></a>                <span class="s1">&#39;structure&#39;</span><span class="p">:</span> <span class="n">structure</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-66"><a href="#CategoricalClassification.generate_data-66"><span class="linenos"> 66</span></a>                <span class="s1">&#39;ensure_rep&#39;</span><span class="p">:</span> <span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-67"><a href="#CategoricalClassification.generate_data-67"><span class="linenos"> 67</span></a>                <span class="s1">&#39;seed&#39;</span><span class="p">:</span> <span class="n">seed</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-68"><a href="#CategoricalClassification.generate_data-68"><span class="linenos"> 68</span></a>            <span class="p">},</span>
+</span><span id="CategoricalClassification.generate_data-69"><a href="#CategoricalClassification.generate_data-69"><span class="linenos"> 69</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification.generate_data-70"><a href="#CategoricalClassification.generate_data-70"><span class="linenos"> 70</span></a>
+</span><span id="CategoricalClassification.generate_data-71"><a href="#CategoricalClassification.generate_data-71"><span class="linenos"> 71</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">seed</span><span class="p">(</span><span class="n">seed</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_data-72"><a href="#CategoricalClassification.generate_data-72"><span class="linenos"> 72</span></a>        <span class="n">X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">empty</span><span class="p">([</span><span class="n">n_features</span><span class="p">,</span> <span class="n">n_samples</span><span class="p">])</span>
+</span><span id="CategoricalClassification.generate_data-73"><a href="#CategoricalClassification.generate_data-73"><span class="linenos"> 73</span></a>
+</span><span id="CategoricalClassification.generate_data-74"><a href="#CategoricalClassification.generate_data-74"><span class="linenos"> 74</span></a>        <span class="k">if</span> <span class="n">structure</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-75"><a href="#CategoricalClassification.generate_data-75"><span class="linenos"> 75</span></a>            <span class="c1"># No specific structure parameter passed</span>
+</span><span id="CategoricalClassification.generate_data-76"><a href="#CategoricalClassification.generate_data-76"><span class="linenos"> 76</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
+</span><span id="CategoricalClassification.generate_data-77"><a href="#CategoricalClassification.generate_data-77"><span class="linenos"> 77</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_data-78"><a href="#CategoricalClassification.generate_data-78"><span class="linenos"> 78</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-79"><a href="#CategoricalClassification.generate_data-79"><span class="linenos"> 79</span></a>                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-80"><a href="#CategoricalClassification.generate_data-80"><span class="linenos"> 80</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-81"><a href="#CategoricalClassification.generate_data-81"><span class="linenos"> 81</span></a>                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-82"><a href="#CategoricalClassification.generate_data-82"><span class="linenos"> 82</span></a>                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-83"><a href="#CategoricalClassification.generate_data-83"><span class="linenos"> 83</span></a>                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-84"><a href="#CategoricalClassification.generate_data-84"><span class="linenos"> 84</span></a>                <span class="p">)</span>
+</span><span id="CategoricalClassification.generate_data-85"><a href="#CategoricalClassification.generate_data-85"><span class="linenos"> 85</span></a>                <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification.generate_data-86"><a href="#CategoricalClassification.generate_data-86"><span class="linenos"> 86</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-87"><a href="#CategoricalClassification.generate_data-87"><span class="linenos"> 87</span></a>            <span class="c1"># Structure parameter passed, building based on structure</span>
+</span><span id="CategoricalClassification.generate_data-88"><a href="#CategoricalClassification.generate_data-88"><span class="linenos"> 88</span></a>            <span class="n">ix</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="CategoricalClassification.generate_data-89"><a href="#CategoricalClassification.generate_data-89"><span class="linenos"> 89</span></a>            <span class="k">for</span> <span class="n">data</span> <span class="ow">in</span> <span class="n">structure</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-90"><a href="#CategoricalClassification.generate_data-90"><span class="linenos"> 90</span></a>                <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">data</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification.generate_data-91"><a href="#CategoricalClassification.generate_data-91"><span class="linenos"> 91</span></a>                    <span class="c1"># Data in structure is a tuple of (feature index (integer), feature attributes)</span>
+</span><span id="CategoricalClassification.generate_data-92"><a href="#CategoricalClassification.generate_data-92"><span class="linenos"> 92</span></a>                    <span class="n">feature_ix</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
+</span><span id="CategoricalClassification.generate_data-93"><a href="#CategoricalClassification.generate_data-93"><span class="linenos"> 93</span></a>
+</span><span id="CategoricalClassification.generate_data-94"><a href="#CategoricalClassification.generate_data-94"><span class="linenos"> 94</span></a>                    <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-95"><a href="#CategoricalClassification.generate_data-95"><span class="linenos"> 95</span></a>                        <span class="c1"># Filling out the dataset up to column index feature_ix</span>
+</span><span id="CategoricalClassification.generate_data-96"><a href="#CategoricalClassification.generate_data-96"><span class="linenos"> 96</span></a>                        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
+</span><span id="CategoricalClassification.generate_data-97"><a href="#CategoricalClassification.generate_data-97"><span class="linenos"> 97</span></a>                            <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_data-98"><a href="#CategoricalClassification.generate_data-98"><span class="linenos"> 98</span></a>                                <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-99"><a href="#CategoricalClassification.generate_data-99"><span class="linenos"> 99</span></a>                                <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-100"><a href="#CategoricalClassification.generate_data-100"><span class="linenos">100</span></a>                                <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-101"><a href="#CategoricalClassification.generate_data-101"><span class="linenos">101</span></a>                                <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-102"><a href="#CategoricalClassification.generate_data-102"><span class="linenos">102</span></a>                                <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-103"><a href="#CategoricalClassification.generate_data-103"><span class="linenos">103</span></a>                                <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-104"><a href="#CategoricalClassification.generate_data-104"><span class="linenos">104</span></a>                            <span class="p">)</span>
+</span><span id="CategoricalClassification.generate_data-105"><a href="#CategoricalClassification.generate_data-105"><span class="linenos">105</span></a>                            <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification.generate_data-106"><a href="#CategoricalClassification.generate_data-106"><span class="linenos">106</span></a>                            <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification.generate_data-107"><a href="#CategoricalClassification.generate_data-107"><span class="linenos">107</span></a>
+</span><span id="CategoricalClassification.generate_data-108"><a href="#CategoricalClassification.generate_data-108"><span class="linenos">108</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_data-109"><a href="#CategoricalClassification.generate_data-109"><span class="linenos">109</span></a>                        <span class="n">feature_attributes</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-110"><a href="#CategoricalClassification.generate_data-110"><span class="linenos">110</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-111"><a href="#CategoricalClassification.generate_data-111"><span class="linenos">111</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-112"><a href="#CategoricalClassification.generate_data-112"><span class="linenos">112</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-113"><a href="#CategoricalClassification.generate_data-113"><span class="linenos">113</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-114"><a href="#CategoricalClassification.generate_data-114"><span class="linenos">114</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-115"><a href="#CategoricalClassification.generate_data-115"><span class="linenos">115</span></a>                    <span class="p">)</span>
+</span><span id="CategoricalClassification.generate_data-116"><a href="#CategoricalClassification.generate_data-116"><span class="linenos">116</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification.generate_data-117"><a href="#CategoricalClassification.generate_data-117"><span class="linenos">117</span></a>                    <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification.generate_data-118"><a href="#CategoricalClassification.generate_data-118"><span class="linenos">118</span></a>
+</span><span id="CategoricalClassification.generate_data-119"><a href="#CategoricalClassification.generate_data-119"><span class="linenos">119</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-120"><a href="#CategoricalClassification.generate_data-120"><span class="linenos">120</span></a>                    <span class="c1"># Data in structure is a tuple of (list of feature indexes, feature attributes)</span>
+</span><span id="CategoricalClassification.generate_data-121"><a href="#CategoricalClassification.generate_data-121"><span class="linenos">121</span></a>                    <span class="n">feature_ixs</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
+</span><span id="CategoricalClassification.generate_data-122"><a href="#CategoricalClassification.generate_data-122"><span class="linenos">122</span></a>
+</span><span id="CategoricalClassification.generate_data-123"><a href="#CategoricalClassification.generate_data-123"><span class="linenos">123</span></a>                    <span class="k">for</span> <span class="n">feature_ix</span> <span class="ow">in</span> <span class="n">feature_ixs</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-124"><a href="#CategoricalClassification.generate_data-124"><span class="linenos">124</span></a>                        <span class="c1"># Filling out the dataset up to feature_ix</span>
+</span><span id="CategoricalClassification.generate_data-125"><a href="#CategoricalClassification.generate_data-125"><span class="linenos">125</span></a>                        <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-126"><a href="#CategoricalClassification.generate_data-126"><span class="linenos">126</span></a>                            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
+</span><span id="CategoricalClassification.generate_data-127"><a href="#CategoricalClassification.generate_data-127"><span class="linenos">127</span></a>                                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_data-128"><a href="#CategoricalClassification.generate_data-128"><span class="linenos">128</span></a>                                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-129"><a href="#CategoricalClassification.generate_data-129"><span class="linenos">129</span></a>                                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-130"><a href="#CategoricalClassification.generate_data-130"><span class="linenos">130</span></a>                                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-131"><a href="#CategoricalClassification.generate_data-131"><span class="linenos">131</span></a>                                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-132"><a href="#CategoricalClassification.generate_data-132"><span class="linenos">132</span></a>                                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-133"><a href="#CategoricalClassification.generate_data-133"><span class="linenos">133</span></a>                                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-134"><a href="#CategoricalClassification.generate_data-134"><span class="linenos">134</span></a>                                <span class="p">)</span>
+</span><span id="CategoricalClassification.generate_data-135"><a href="#CategoricalClassification.generate_data-135"><span class="linenos">135</span></a>                                <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification.generate_data-136"><a href="#CategoricalClassification.generate_data-136"><span class="linenos">136</span></a>                                <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification.generate_data-137"><a href="#CategoricalClassification.generate_data-137"><span class="linenos">137</span></a>
+</span><span id="CategoricalClassification.generate_data-138"><a href="#CategoricalClassification.generate_data-138"><span class="linenos">138</span></a>                        <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_data-139"><a href="#CategoricalClassification.generate_data-139"><span class="linenos">139</span></a>                            <span class="n">feature_attributes</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-140"><a href="#CategoricalClassification.generate_data-140"><span class="linenos">140</span></a>                            <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-141"><a href="#CategoricalClassification.generate_data-141"><span class="linenos">141</span></a>                            <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-142"><a href="#CategoricalClassification.generate_data-142"><span class="linenos">142</span></a>                            <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-143"><a href="#CategoricalClassification.generate_data-143"><span class="linenos">143</span></a>                            <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-144"><a href="#CategoricalClassification.generate_data-144"><span class="linenos">144</span></a>                            <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-145"><a href="#CategoricalClassification.generate_data-145"><span class="linenos">145</span></a>                        <span class="p">)</span>
+</span><span id="CategoricalClassification.generate_data-146"><a href="#CategoricalClassification.generate_data-146"><span class="linenos">146</span></a>
+</span><span id="CategoricalClassification.generate_data-147"><a href="#CategoricalClassification.generate_data-147"><span class="linenos">147</span></a>                        <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification.generate_data-148"><a href="#CategoricalClassification.generate_data-148"><span class="linenos">148</span></a>                        <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification.generate_data-149"><a href="#CategoricalClassification.generate_data-149"><span class="linenos">149</span></a>
+</span><span id="CategoricalClassification.generate_data-150"><a href="#CategoricalClassification.generate_data-150"><span class="linenos">150</span></a>            <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">n_features</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-151"><a href="#CategoricalClassification.generate_data-151"><span class="linenos">151</span></a>                <span class="c1"># Fill out the rest of the dataset</span>
+</span><span id="CategoricalClassification.generate_data-152"><a href="#CategoricalClassification.generate_data-152"><span class="linenos">152</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">n_features</span><span class="p">):</span>
+</span><span id="CategoricalClassification.generate_data-153"><a href="#CategoricalClassification.generate_data-153"><span class="linenos">153</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_data-154"><a href="#CategoricalClassification.generate_data-154"><span class="linenos">154</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-155"><a href="#CategoricalClassification.generate_data-155"><span class="linenos">155</span></a>                        <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-156"><a href="#CategoricalClassification.generate_data-156"><span class="linenos">156</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-157"><a href="#CategoricalClassification.generate_data-157"><span class="linenos">157</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-158"><a href="#CategoricalClassification.generate_data-158"><span class="linenos">158</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-159"><a href="#CategoricalClassification.generate_data-159"><span class="linenos">159</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-160"><a href="#CategoricalClassification.generate_data-160"><span class="linenos">160</span></a>                    <span class="p">)</span>
+</span><span id="CategoricalClassification.generate_data-161"><a href="#CategoricalClassification.generate_data-161"><span class="linenos">161</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification.generate_data-162"><a href="#CategoricalClassification.generate_data-162"><span class="linenos">162</span></a>
+</span><span id="CategoricalClassification.generate_data-163"><a href="#CategoricalClassification.generate_data-163"><span class="linenos">163</span></a>        <span class="k">return</span> <span class="n">X</span><span class="o">.</span><span class="n">T</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Generates dataset based on given parameters</p>
+
+<h6 id="parameters">Parameters</h6>
+
+<ul>
+<li><strong>n_features</strong>:  number of generated features</li>
+<li><strong>n_samples</strong>:  number of generated samples</li>
+<li><strong>cardinality</strong>:  default cardinality of the dataset</li>
+<li><strong>structure</strong>:  structure of the dataset</li>
+<li><strong>ensure_rep</strong>:  flag, ensures all given values represented</li>
+<li><strong>random_values</strong>:  flag, enables random (integer) feature values from set [low, high]</li>
+<li><strong>low</strong>:  sets lower bound of random feature values</li>
+<li><strong>high</strong>:  sets high bound of random feature values</li>
+<li><strong>seed</strong>:  sets seed of numpy random</li>
+</ul>
+
+<h6 id="returns">Returns</h6>
+
+<blockquote>
+  <p>X, 2D dataset</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="CategoricalClassification.generate_combinations" class="classattr">
+                                        <input id="CategoricalClassification.generate_combinations-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">generate_combinations</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">X</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">feature_indices</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">combination_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">combination_type</span><span class="p">:</span> <span class="n">Literal</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span></span><span class="return-annotation">) -> <span class="n">numpy</span><span class="o">.</span><span class="n">ndarray</span>:</span></span>
+
+                <label class="view-source-button" for="CategoricalClassification.generate_combinations-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#CategoricalClassification.generate_combinations"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_combinations-267"><a href="#CategoricalClassification.generate_combinations-267"><span class="linenos">267</span></a>    <span class="k">def</span> <span class="nf">generate_combinations</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_combinations-268"><a href="#CategoricalClassification.generate_combinations-268"><span class="linenos">268</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_combinations-269"><a href="#CategoricalClassification.generate_combinations-269"><span class="linenos">269</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_combinations-270"><a href="#CategoricalClassification.generate_combinations-270"><span class="linenos">270</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_combinations-271"><a href="#CategoricalClassification.generate_combinations-271"><span class="linenos">271</span></a>        <span class="n">combination_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_combinations-272"><a href="#CategoricalClassification.generate_combinations-272"><span class="linenos">272</span></a>        <span class="n">combination_type</span><span class="p">:</span> <span class="n">Literal</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_combinations-273"><a href="#CategoricalClassification.generate_combinations-273"><span class="linenos">273</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_combinations-274"><a href="#CategoricalClassification.generate_combinations-274"><span class="linenos">274</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_combinations-275"><a href="#CategoricalClassification.generate_combinations-275"><span class="linenos">275</span></a><span class="sd">        Generates linear, nonlinear, or custom combinations within feature vectors in given dataset X</span>
+</span><span id="CategoricalClassification.generate_combinations-276"><a href="#CategoricalClassification.generate_combinations-276"><span class="linenos">276</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification.generate_combinations-277"><a href="#CategoricalClassification.generate_combinations-277"><span class="linenos">277</span></a><span class="sd">        :param feature_indices: indexes of features to be in combination</span>
+</span><span id="CategoricalClassification.generate_combinations-278"><a href="#CategoricalClassification.generate_combinations-278"><span class="linenos">278</span></a><span class="sd">        :param combination_function: optional custom function for combining feature vectors</span>
+</span><span id="CategoricalClassification.generate_combinations-279"><a href="#CategoricalClassification.generate_combinations-279"><span class="linenos">279</span></a><span class="sd">        :param combination_type: string flag, either liner or nonlinear, defining combination type</span>
+</span><span id="CategoricalClassification.generate_combinations-280"><a href="#CategoricalClassification.generate_combinations-280"><span class="linenos">280</span></a><span class="sd">        :return: X with added resultant feature</span>
+</span><span id="CategoricalClassification.generate_combinations-281"><a href="#CategoricalClassification.generate_combinations-281"><span class="linenos">281</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_combinations-282"><a href="#CategoricalClassification.generate_combinations-282"><span class="linenos">282</span></a>
+</span><span id="CategoricalClassification.generate_combinations-283"><a href="#CategoricalClassification.generate_combinations-283"><span class="linenos">283</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_combinations-284"><a href="#CategoricalClassification.generate_combinations-284"><span class="linenos">284</span></a>
+</span><span id="CategoricalClassification.generate_combinations-285"><a href="#CategoricalClassification.generate_combinations-285"><span class="linenos">285</span></a>        <span class="k">if</span> <span class="n">combination_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_combinations-286"><a href="#CategoricalClassification.generate_combinations-286"><span class="linenos">286</span></a>            <span class="k">if</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_combinations-287"><a href="#CategoricalClassification.generate_combinations-287"><span class="linenos">287</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_combinations-288"><a href="#CategoricalClassification.generate_combinations-288"><span class="linenos">288</span></a>            <span class="k">elif</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_combinations-289"><a href="#CategoricalClassification.generate_combinations-289"><span class="linenos">289</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_combinations-290"><a href="#CategoricalClassification.generate_combinations-290"><span class="linenos">290</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_combinations-291"><a href="#CategoricalClassification.generate_combinations-291"><span class="linenos">291</span></a>            <span class="n">combination_type</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">combination_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_combinations-292"><a href="#CategoricalClassification.generate_combinations-292"><span class="linenos">292</span></a>
+</span><span id="CategoricalClassification.generate_combinations-293"><a href="#CategoricalClassification.generate_combinations-293"><span class="linenos">293</span></a>        <span class="n">combination_result</span> <span class="o">=</span> <span class="n">combination_function</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_combinations-294"><a href="#CategoricalClassification.generate_combinations-294"><span class="linenos">294</span></a>
+</span><span id="CategoricalClassification.generate_combinations-295"><a href="#CategoricalClassification.generate_combinations-295"><span class="linenos">295</span></a>        <span class="n">combination_ix</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="CategoricalClassification.generate_combinations-296"><a href="#CategoricalClassification.generate_combinations-296"><span class="linenos">296</span></a>
+</span><span id="CategoricalClassification.generate_combinations-297"><a href="#CategoricalClassification.generate_combinations-297"><span class="linenos">297</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="CategoricalClassification.generate_combinations-298"><a href="#CategoricalClassification.generate_combinations-298"><span class="linenos">298</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_combinations-299"><a href="#CategoricalClassification.generate_combinations-299"><span class="linenos">299</span></a>            <span class="s1">&#39;combination_type&#39;</span><span class="p">:</span> <span class="n">combination_type</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_combinations-300"><a href="#CategoricalClassification.generate_combinations-300"><span class="linenos">300</span></a>            <span class="s1">&#39;combination_ix&#39;</span><span class="p">:</span> <span class="n">combination_ix</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_combinations-301"><a href="#CategoricalClassification.generate_combinations-301"><span class="linenos">301</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification.generate_combinations-302"><a href="#CategoricalClassification.generate_combinations-302"><span class="linenos">302</span></a>
+</span><span id="CategoricalClassification.generate_combinations-303"><a href="#CategoricalClassification.generate_combinations-303"><span class="linenos">303</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">combination_result</span><span class="p">))</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Generates linear, nonlinear, or custom combinations within feature vectors in given dataset X</p>
+
+<h6 id="parameters">Parameters</h6>
+
+<ul>
+<li><strong>X</strong>:  dataset</li>
+<li><strong>feature_indices</strong>:  indexes of features to be in combination</li>
+<li><strong>combination_function</strong>:  optional custom function for combining feature vectors</li>
+<li><strong>combination_type</strong>:  string flag, either liner or nonlinear, defining combination type</li>
+</ul>
+
+<h6 id="returns">Returns</h6>
+
+<blockquote>
+  <p>X with added resultant feature</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="CategoricalClassification.generate_correlated" class="classattr">
+                                        <input id="CategoricalClassification.generate_correlated-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">generate_correlated</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">X</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">feature_indices</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">r</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.8</span></span><span class="return-annotation">) -> <span class="n">numpy</span><span class="o">.</span><span class="n">ndarray</span>:</span></span>
+
+                <label class="view-source-button" for="CategoricalClassification.generate_correlated-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#CategoricalClassification.generate_correlated"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_correlated-350"><a href="#CategoricalClassification.generate_correlated-350"><span class="linenos">350</span></a>    <span class="k">def</span> <span class="nf">generate_correlated</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_correlated-351"><a href="#CategoricalClassification.generate_correlated-351"><span class="linenos">351</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_correlated-352"><a href="#CategoricalClassification.generate_correlated-352"><span class="linenos">352</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_correlated-353"><a href="#CategoricalClassification.generate_correlated-353"><span class="linenos">353</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_correlated-354"><a href="#CategoricalClassification.generate_correlated-354"><span class="linenos">354</span></a>        <span class="n">r</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.8</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_correlated-355"><a href="#CategoricalClassification.generate_correlated-355"><span class="linenos">355</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_correlated-356"><a href="#CategoricalClassification.generate_correlated-356"><span class="linenos">356</span></a>
+</span><span id="CategoricalClassification.generate_correlated-357"><a href="#CategoricalClassification.generate_correlated-357"><span class="linenos">357</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_correlated-358"><a href="#CategoricalClassification.generate_correlated-358"><span class="linenos">358</span></a><span class="sd">        Generates correlated features using the given feature indices. Correlation is based on cosine of angle between vectors with mean 0.</span>
+</span><span id="CategoricalClassification.generate_correlated-359"><a href="#CategoricalClassification.generate_correlated-359"><span class="linenos">359</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification.generate_correlated-360"><a href="#CategoricalClassification.generate_correlated-360"><span class="linenos">360</span></a><span class="sd">        :param feature_indices: indices of features to generate correlated feature to</span>
+</span><span id="CategoricalClassification.generate_correlated-361"><a href="#CategoricalClassification.generate_correlated-361"><span class="linenos">361</span></a><span class="sd">        :param r: (Pearson) correlation factor</span>
+</span><span id="CategoricalClassification.generate_correlated-362"><a href="#CategoricalClassification.generate_correlated-362"><span class="linenos">362</span></a><span class="sd">        :return: X with generated correlated  features</span>
+</span><span id="CategoricalClassification.generate_correlated-363"><a href="#CategoricalClassification.generate_correlated-363"><span class="linenos">363</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_correlated-364"><a href="#CategoricalClassification.generate_correlated-364"><span class="linenos">364</span></a>
+</span><span id="CategoricalClassification.generate_correlated-365"><a href="#CategoricalClassification.generate_correlated-365"><span class="linenos">365</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification.generate_correlated-366"><a href="#CategoricalClassification.generate_correlated-366"><span class="linenos">366</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
+</span><span id="CategoricalClassification.generate_correlated-367"><a href="#CategoricalClassification.generate_correlated-367"><span class="linenos">367</span></a>
+</span><span id="CategoricalClassification.generate_correlated-368"><a href="#CategoricalClassification.generate_correlated-368"><span class="linenos">368</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_correlated-369"><a href="#CategoricalClassification.generate_correlated-369"><span class="linenos">369</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)),</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_correlated-370"><a href="#CategoricalClassification.generate_correlated-370"><span class="linenos">370</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_correlated-371"><a href="#CategoricalClassification.generate_correlated-371"><span class="linenos">371</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="CategoricalClassification.generate_correlated-372"><a href="#CategoricalClassification.generate_correlated-372"><span class="linenos">372</span></a>
+</span><span id="CategoricalClassification.generate_correlated-373"><a href="#CategoricalClassification.generate_correlated-373"><span class="linenos">373</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_correlated-374"><a href="#CategoricalClassification.generate_correlated-374"><span class="linenos">374</span></a>        <span class="n">transposed</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_correlated-375"><a href="#CategoricalClassification.generate_correlated-375"><span class="linenos">375</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification.generate_correlated-376"><a href="#CategoricalClassification.generate_correlated-376"><span class="linenos">376</span></a>
+</span><span id="CategoricalClassification.generate_correlated-377"><a href="#CategoricalClassification.generate_correlated-377"><span class="linenos">377</span></a>        <span class="k">for</span> <span class="n">t</span> <span class="ow">in</span> <span class="n">transposed</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_correlated-378"><a href="#CategoricalClassification.generate_correlated-378"><span class="linenos">378</span></a>            <span class="n">theta</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arccos</span><span class="p">(</span><span class="n">r</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_correlated-379"><a href="#CategoricalClassification.generate_correlated-379"><span class="linenos">379</span></a>            <span class="n">t_standard</span> <span class="o">=</span> <span class="p">(</span><span class="n">t</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">t</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">t</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_correlated-380"><a href="#CategoricalClassification.generate_correlated-380"><span class="linenos">380</span></a>
+</span><span id="CategoricalClassification.generate_correlated-381"><a href="#CategoricalClassification.generate_correlated-381"><span class="linenos">381</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">normal</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">t_standard</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_correlated-382"><a href="#CategoricalClassification.generate_correlated-382"><span class="linenos">382</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="p">(</span><span class="n">rand</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">rand</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">rand</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_correlated-383"><a href="#CategoricalClassification.generate_correlated-383"><span class="linenos">383</span></a>
+</span><span id="CategoricalClassification.generate_correlated-384"><a href="#CategoricalClassification.generate_correlated-384"><span class="linenos">384</span></a>            <span class="n">M</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">t_standard</span><span class="p">,</span> <span class="n">rand</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_correlated-385"><a href="#CategoricalClassification.generate_correlated-385"><span class="linenos">385</span></a>            <span class="n">M_centred</span> <span class="o">=</span> <span class="p">(</span><span class="n">M</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">M</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_correlated-386"><a href="#CategoricalClassification.generate_correlated-386"><span class="linenos">386</span></a>
+</span><span id="CategoricalClassification.generate_correlated-387"><a href="#CategoricalClassification.generate_correlated-387"><span class="linenos">387</span></a>            <span class="n">Id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">eye</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">t</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_correlated-388"><a href="#CategoricalClassification.generate_correlated-388"><span class="linenos">388</span></a>            <span class="n">Q</span> <span class="o">=</span> <span class="n">qr</span><span class="p">(</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="p">[</span><span class="mi">0</span><span class="p">]],</span> <span class="n">mode</span><span class="o">=</span><span class="s1">&#39;economic&#39;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_correlated-389"><a href="#CategoricalClassification.generate_correlated-389"><span class="linenos">389</span></a>            <span class="n">P</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Q</span><span class="p">,</span> <span class="n">Q</span><span class="o">.</span><span class="n">T</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_correlated-390"><a href="#CategoricalClassification.generate_correlated-390"><span class="linenos">390</span></a>            <span class="n">orthogonal_projection</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Id</span> <span class="o">-</span> <span class="n">P</span><span class="p">,</span> <span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">])</span>
+</span><span id="CategoricalClassification.generate_correlated-391"><a href="#CategoricalClassification.generate_correlated-391"><span class="linenos">391</span></a>            <span class="n">M_orthogonal</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">],</span> <span class="n">orthogonal_projection</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_correlated-392"><a href="#CategoricalClassification.generate_correlated-392"><span class="linenos">392</span></a>
+</span><span id="CategoricalClassification.generate_correlated-393"><a href="#CategoricalClassification.generate_correlated-393"><span class="linenos">393</span></a>            <span class="n">Y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">M_orthogonal</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">M_orthogonal</span> <span class="o">**</span> <span class="mi">2</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))))</span>
+</span><span id="CategoricalClassification.generate_correlated-394"><a href="#CategoricalClassification.generate_correlated-394"><span class="linenos">394</span></a>            <span class="n">corr</span> <span class="o">=</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">tan</span><span class="p">(</span><span class="n">theta</span><span class="p">))</span> <span class="o">*</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_correlated-395"><a href="#CategoricalClassification.generate_correlated-395"><span class="linenos">395</span></a>
+</span><span id="CategoricalClassification.generate_correlated-396"><a href="#CategoricalClassification.generate_correlated-396"><span class="linenos">396</span></a>            <span class="n">correlated_features</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">corr</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_correlated-397"><a href="#CategoricalClassification.generate_correlated-397"><span class="linenos">397</span></a>
+</span><span id="CategoricalClassification.generate_correlated-398"><a href="#CategoricalClassification.generate_correlated-398"><span class="linenos">398</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">correlated_features</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_correlated-399"><a href="#CategoricalClassification.generate_correlated-399"><span class="linenos">399</span></a>
+</span><span id="CategoricalClassification.generate_correlated-400"><a href="#CategoricalClassification.generate_correlated-400"><span class="linenos">400</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="CategoricalClassification.generate_correlated-401"><a href="#CategoricalClassification.generate_correlated-401"><span class="linenos">401</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_correlated-402"><a href="#CategoricalClassification.generate_correlated-402"><span class="linenos">402</span></a>            <span class="s1">&#39;correlated_indices&#39;</span><span class="p">:</span> <span class="n">correlated_ixs</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_correlated-403"><a href="#CategoricalClassification.generate_correlated-403"><span class="linenos">403</span></a>            <span class="s1">&#39;correlation_factor&#39;</span><span class="p">:</span> <span class="n">r</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_correlated-404"><a href="#CategoricalClassification.generate_correlated-404"><span class="linenos">404</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification.generate_correlated-405"><a href="#CategoricalClassification.generate_correlated-405"><span class="linenos">405</span></a>
+</span><span id="CategoricalClassification.generate_correlated-406"><a href="#CategoricalClassification.generate_correlated-406"><span class="linenos">406</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">correlated_features</span><span class="p">))</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Generates correlated features using the given feature indices. Correlation is based on cosine of angle between vectors with mean 0.</p>
+
+<h6 id="parameters">Parameters</h6>
+
+<ul>
+<li><strong>X</strong>:  dataset</li>
+<li><strong>feature_indices</strong>:  indices of features to generate correlated feature to</li>
+<li><strong>r</strong>:  (Pearson) correlation factor</li>
+</ul>
+
+<h6 id="returns">Returns</h6>
+
+<blockquote>
+  <p>X with generated correlated  features</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="CategoricalClassification.generate_duplicates" class="classattr">
+                                        <input id="CategoricalClassification.generate_duplicates-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">generate_duplicates</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">X</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">feature_indices</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span></span><span class="return-annotation">) -> <span class="n">numpy</span><span class="o">.</span><span class="n">ndarray</span>:</span></span>
+
+                <label class="view-source-button" for="CategoricalClassification.generate_duplicates-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#CategoricalClassification.generate_duplicates"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_duplicates-408"><a href="#CategoricalClassification.generate_duplicates-408"><span class="linenos">408</span></a>    <span class="k">def</span> <span class="nf">generate_duplicates</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_duplicates-409"><a href="#CategoricalClassification.generate_duplicates-409"><span class="linenos">409</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_duplicates-410"><a href="#CategoricalClassification.generate_duplicates-410"><span class="linenos">410</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_duplicates-411"><a href="#CategoricalClassification.generate_duplicates-411"><span class="linenos">411</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_duplicates-412"><a href="#CategoricalClassification.generate_duplicates-412"><span class="linenos">412</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_duplicates-413"><a href="#CategoricalClassification.generate_duplicates-413"><span class="linenos">413</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_duplicates-414"><a href="#CategoricalClassification.generate_duplicates-414"><span class="linenos">414</span></a><span class="sd">        Generates duplicate features</span>
+</span><span id="CategoricalClassification.generate_duplicates-415"><a href="#CategoricalClassification.generate_duplicates-415"><span class="linenos">415</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification.generate_duplicates-416"><a href="#CategoricalClassification.generate_duplicates-416"><span class="linenos">416</span></a><span class="sd">        :param feature_indices: indices of features to duplicate</span>
+</span><span id="CategoricalClassification.generate_duplicates-417"><a href="#CategoricalClassification.generate_duplicates-417"><span class="linenos">417</span></a><span class="sd">        :return: dataset with duplicated features</span>
+</span><span id="CategoricalClassification.generate_duplicates-418"><a href="#CategoricalClassification.generate_duplicates-418"><span class="linenos">418</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_duplicates-419"><a href="#CategoricalClassification.generate_duplicates-419"><span class="linenos">419</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification.generate_duplicates-420"><a href="#CategoricalClassification.generate_duplicates-420"><span class="linenos">420</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
+</span><span id="CategoricalClassification.generate_duplicates-421"><a href="#CategoricalClassification.generate_duplicates-421"><span class="linenos">421</span></a>
+</span><span id="CategoricalClassification.generate_duplicates-422"><a href="#CategoricalClassification.generate_duplicates-422"><span class="linenos">422</span></a>        <span class="n">duplicated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">),</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_duplicates-423"><a href="#CategoricalClassification.generate_duplicates-423"><span class="linenos">423</span></a>
+</span><span id="CategoricalClassification.generate_duplicates-424"><a href="#CategoricalClassification.generate_duplicates-424"><span class="linenos">424</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_duplicates-425"><a href="#CategoricalClassification.generate_duplicates-425"><span class="linenos">425</span></a>
+</span><span id="CategoricalClassification.generate_duplicates-426"><a href="#CategoricalClassification.generate_duplicates-426"><span class="linenos">426</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="CategoricalClassification.generate_duplicates-427"><a href="#CategoricalClassification.generate_duplicates-427"><span class="linenos">427</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_duplicates-428"><a href="#CategoricalClassification.generate_duplicates-428"><span class="linenos">428</span></a>            <span class="s1">&#39;duplicate_indices&#39;</span><span class="p">:</span> <span class="n">duplicated_ixs</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_duplicates-429"><a href="#CategoricalClassification.generate_duplicates-429"><span class="linenos">429</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification.generate_duplicates-430"><a href="#CategoricalClassification.generate_duplicates-430"><span class="linenos">430</span></a>
+</span><span id="CategoricalClassification.generate_duplicates-431"><a href="#CategoricalClassification.generate_duplicates-431"><span class="linenos">431</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">selected_features</span><span class="p">))</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Generates duplicate features</p>
+
+<h6 id="parameters">Parameters</h6>
+
+<ul>
+<li><strong>X</strong>:  dataset</li>
+<li><strong>feature_indices</strong>:  indices of features to duplicate</li>
+</ul>
+
+<h6 id="returns">Returns</h6>
+
+<blockquote>
+  <p>dataset with duplicated features</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="CategoricalClassification.generate_labels" class="classattr">
+                                        <input id="CategoricalClassification.generate_labels-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">generate_labels</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">X</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">2</span>,</span><span class="param">	<span class="n">p</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span> <span class="o">=</span> <span class="mf">0.5</span>,</span><span class="param">	<span class="n">k</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">2</span>,</span><span class="param">	<span class="n">decision_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">class_relation</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span>,</span><span class="param">	<span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span></span><span class="return-annotation">):</span></span>
+
+                <label class="view-source-button" for="CategoricalClassification.generate_labels-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#CategoricalClassification.generate_labels"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_labels-433"><a href="#CategoricalClassification.generate_labels-433"><span class="linenos">433</span></a>    <span class="k">def</span> <span class="nf">generate_labels</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_labels-434"><a href="#CategoricalClassification.generate_labels-434"><span class="linenos">434</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-435"><a href="#CategoricalClassification.generate_labels-435"><span class="linenos">435</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-436"><a href="#CategoricalClassification.generate_labels-436"><span class="linenos">436</span></a>        <span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-437"><a href="#CategoricalClassification.generate_labels-437"><span class="linenos">437</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">|</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">=</span> <span class="mf">0.5</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-438"><a href="#CategoricalClassification.generate_labels-438"><span class="linenos">438</span></a>        <span class="n">k</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-439"><a href="#CategoricalClassification.generate_labels-439"><span class="linenos">439</span></a>        <span class="n">decision_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-440"><a href="#CategoricalClassification.generate_labels-440"><span class="linenos">440</span></a>        <span class="n">class_relation</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-441"><a href="#CategoricalClassification.generate_labels-441"><span class="linenos">441</span></a>        <span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-442"><a href="#CategoricalClassification.generate_labels-442"><span class="linenos">442</span></a>    <span class="p">):</span>
+</span><span id="CategoricalClassification.generate_labels-443"><a href="#CategoricalClassification.generate_labels-443"><span class="linenos">443</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_labels-444"><a href="#CategoricalClassification.generate_labels-444"><span class="linenos">444</span></a><span class="sd">        Generates labels for dataset X</span>
+</span><span id="CategoricalClassification.generate_labels-445"><a href="#CategoricalClassification.generate_labels-445"><span class="linenos">445</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification.generate_labels-446"><a href="#CategoricalClassification.generate_labels-446"><span class="linenos">446</span></a><span class="sd">        :param n: number of class labels</span>
+</span><span id="CategoricalClassification.generate_labels-447"><a href="#CategoricalClassification.generate_labels-447"><span class="linenos">447</span></a><span class="sd">        :param p: class distribution</span>
+</span><span id="CategoricalClassification.generate_labels-448"><a href="#CategoricalClassification.generate_labels-448"><span class="linenos">448</span></a><span class="sd">        :param k: constant</span>
+</span><span id="CategoricalClassification.generate_labels-449"><a href="#CategoricalClassification.generate_labels-449"><span class="linenos">449</span></a><span class="sd">        :param decision_function: optional user-defined decision function</span>
+</span><span id="CategoricalClassification.generate_labels-450"><a href="#CategoricalClassification.generate_labels-450"><span class="linenos">450</span></a><span class="sd">        :param class_relation: string, either &#39;linear&#39;, &#39;nonlinear&#39;, or &#39;cluster&#39;</span>
+</span><span id="CategoricalClassification.generate_labels-451"><a href="#CategoricalClassification.generate_labels-451"><span class="linenos">451</span></a><span class="sd">        :param balance: boolean, whether to balance clustering class labels</span>
+</span><span id="CategoricalClassification.generate_labels-452"><a href="#CategoricalClassification.generate_labels-452"><span class="linenos">452</span></a><span class="sd">        :return: array of labels, corresponding to dataset X</span>
+</span><span id="CategoricalClassification.generate_labels-453"><a href="#CategoricalClassification.generate_labels-453"><span class="linenos">453</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_labels-454"><a href="#CategoricalClassification.generate_labels-454"><span class="linenos">454</span></a>
+</span><span id="CategoricalClassification.generate_labels-455"><a href="#CategoricalClassification.generate_labels-455"><span class="linenos">455</span></a>        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification.generate_labels-456"><a href="#CategoricalClassification.generate_labels-456"><span class="linenos">456</span></a>            <span class="k">if</span> <span class="nb">sum</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;sum of values in must be less than 1.0&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-457"><a href="#CategoricalClassification.generate_labels-457"><span class="linenos">457</span></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">n</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;length of p must equal n&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-458"><a href="#CategoricalClassification.generate_labels-458"><span class="linenos">458</span></a>
+</span><span id="CategoricalClassification.generate_labels-459"><a href="#CategoricalClassification.generate_labels-459"><span class="linenos">459</span></a>        <span class="k">if</span> <span class="n">p</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;p must be less than 1.0&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-460"><a href="#CategoricalClassification.generate_labels-460"><span class="linenos">460</span></a>
+</span><span id="CategoricalClassification.generate_labels-461"><a href="#CategoricalClassification.generate_labels-461"><span class="linenos">461</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification.generate_labels-462"><a href="#CategoricalClassification.generate_labels-462"><span class="linenos">462</span></a>
+</span><span id="CategoricalClassification.generate_labels-463"><a href="#CategoricalClassification.generate_labels-463"><span class="linenos">463</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-464"><a href="#CategoricalClassification.generate_labels-464"><span class="linenos">464</span></a>            <span class="k">if</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-465"><a href="#CategoricalClassification.generate_labels-465"><span class="linenos">465</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="n">x</span> <span class="o">+</span> <span class="mi">3</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-466"><a href="#CategoricalClassification.generate_labels-466"><span class="linenos">466</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-467"><a href="#CategoricalClassification.generate_labels-467"><span class="linenos">467</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="o">+</span> <span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">cos</span><span class="p">(</span><span class="n">x</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-468"><a href="#CategoricalClassification.generate_labels-468"><span class="linenos">468</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;cluster&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-469"><a href="#CategoricalClassification.generate_labels-469"><span class="linenos">469</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="CategoricalClassification.generate_labels-470"><a href="#CategoricalClassification.generate_labels-470"><span class="linenos">470</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-471"><a href="#CategoricalClassification.generate_labels-471"><span class="linenos">471</span></a>            <span class="n">class_relation</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">decision_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-472"><a href="#CategoricalClassification.generate_labels-472"><span class="linenos">472</span></a>
+</span><span id="CategoricalClassification.generate_labels-473"><a href="#CategoricalClassification.generate_labels-473"><span class="linenos">473</span></a>        <span class="n">y</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification.generate_labels-474"><a href="#CategoricalClassification.generate_labels-474"><span class="linenos">474</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-475"><a href="#CategoricalClassification.generate_labels-475"><span class="linenos">475</span></a>            <span class="k">if</span> <span class="n">n</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-476"><a href="#CategoricalClassification.generate_labels-476"><span class="linenos">476</span></a>                <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">list</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-477"><a href="#CategoricalClassification.generate_labels-477"><span class="linenos">477</span></a>                    <span class="n">p</span> <span class="o">=</span> <span class="mi">1</span> <span class="o">/</span> <span class="n">n</span>
+</span><span id="CategoricalClassification.generate_labels-478"><a href="#CategoricalClassification.generate_labels-478"><span class="linenos">478</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_labels-479"><a href="#CategoricalClassification.generate_labels-479"><span class="linenos">479</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="CategoricalClassification.generate_labels-480"><a href="#CategoricalClassification.generate_labels-480"><span class="linenos">480</span></a>                        <span class="n">percentiles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_labels-481"><a href="#CategoricalClassification.generate_labels-481"><span class="linenos">481</span></a>
+</span><span id="CategoricalClassification.generate_labels-482"><a href="#CategoricalClassification.generate_labels-482"><span class="linenos">482</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-483"><a href="#CategoricalClassification.generate_labels-483"><span class="linenos">483</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-484"><a href="#CategoricalClassification.generate_labels-484"><span class="linenos">484</span></a>
+</span><span id="CategoricalClassification.generate_labels-485"><a href="#CategoricalClassification.generate_labels-485"><span class="linenos">485</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-486"><a href="#CategoricalClassification.generate_labels-486"><span class="linenos">486</span></a>                    <span class="k">for</span> <span class="n">p_point</span> <span class="ow">in</span> <span class="n">p_points</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-487"><a href="#CategoricalClassification.generate_labels-487"><span class="linenos">487</span></a>                        <span class="n">y</span> <span class="o">+=</span> <span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-488"><a href="#CategoricalClassification.generate_labels-488"><span class="linenos">488</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-489"><a href="#CategoricalClassification.generate_labels-489"><span class="linenos">489</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-490"><a href="#CategoricalClassification.generate_labels-490"><span class="linenos">490</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="o">*</span> <span class="mi">100</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">p</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_labels-491"><a href="#CategoricalClassification.generate_labels-491"><span class="linenos">491</span></a>
+</span><span id="CategoricalClassification.generate_labels-492"><a href="#CategoricalClassification.generate_labels-492"><span class="linenos">492</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="CategoricalClassification.generate_labels-493"><a href="#CategoricalClassification.generate_labels-493"><span class="linenos">493</span></a>                        <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">+=</span> <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_labels-494"><a href="#CategoricalClassification.generate_labels-494"><span class="linenos">494</span></a>
+</span><span id="CategoricalClassification.generate_labels-495"><a href="#CategoricalClassification.generate_labels-495"><span class="linenos">495</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">insert</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-496"><a href="#CategoricalClassification.generate_labels-496"><span class="linenos">496</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">pop</span><span class="p">()</span>
+</span><span id="CategoricalClassification.generate_labels-497"><a href="#CategoricalClassification.generate_labels-497"><span class="linenos">497</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-498"><a href="#CategoricalClassification.generate_labels-498"><span class="linenos">498</span></a>
+</span><span id="CategoricalClassification.generate_labels-499"><a href="#CategoricalClassification.generate_labels-499"><span class="linenos">499</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-500"><a href="#CategoricalClassification.generate_labels-500"><span class="linenos">500</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">p_points</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-501"><a href="#CategoricalClassification.generate_labels-501"><span class="linenos">501</span></a>
+</span><span id="CategoricalClassification.generate_labels-502"><a href="#CategoricalClassification.generate_labels-502"><span class="linenos">502</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-503"><a href="#CategoricalClassification.generate_labels-503"><span class="linenos">503</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span><span class="p">):</span>
+</span><span id="CategoricalClassification.generate_labels-504"><a href="#CategoricalClassification.generate_labels-504"><span class="linenos">504</span></a>                        <span class="n">p_point</span> <span class="o">=</span> <span class="n">p_points</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_labels-505"><a href="#CategoricalClassification.generate_labels-505"><span class="linenos">505</span></a>                        <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">)):</span>
+</span><span id="CategoricalClassification.generate_labels-506"><a href="#CategoricalClassification.generate_labels-506"><span class="linenos">506</span></a>                            <span class="k">if</span> <span class="n">decision_boundary</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-507"><a href="#CategoricalClassification.generate_labels-507"><span class="linenos">507</span></a>                                <span class="n">y</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification.generate_labels-508"><a href="#CategoricalClassification.generate_labels-508"><span class="linenos">508</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-509"><a href="#CategoricalClassification.generate_labels-509"><span class="linenos">509</span></a>                <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-510"><a href="#CategoricalClassification.generate_labels-510"><span class="linenos">510</span></a>                <span class="n">p_point</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-511"><a href="#CategoricalClassification.generate_labels-511"><span class="linenos">511</span></a>                <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-512"><a href="#CategoricalClassification.generate_labels-512"><span class="linenos">512</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-513"><a href="#CategoricalClassification.generate_labels-513"><span class="linenos">513</span></a>            <span class="k">if</span> <span class="n">p</span> <span class="o">==</span> <span class="mf">0.5</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-514"><a href="#CategoricalClassification.generate_labels-514"><span class="linenos">514</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="mf">1.0</span>
+</span><span id="CategoricalClassification.generate_labels-515"><a href="#CategoricalClassification.generate_labels-515"><span class="linenos">515</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-516"><a href="#CategoricalClassification.generate_labels-516"><span class="linenos">516</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span><span class="p">,</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">p</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_labels-517"><a href="#CategoricalClassification.generate_labels-517"><span class="linenos">517</span></a>            <span class="n">y</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_cluster_data</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">n</span><span class="p">,</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">,</span> <span class="n">balance</span><span class="o">=</span><span class="n">balance</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-518"><a href="#CategoricalClassification.generate_labels-518"><span class="linenos">518</span></a>
+</span><span id="CategoricalClassification.generate_labels-519"><a href="#CategoricalClassification.generate_labels-519"><span class="linenos">519</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="CategoricalClassification.generate_labels-520"><a href="#CategoricalClassification.generate_labels-520"><span class="linenos">520</span></a>            <span class="s1">&#39;labels&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="CategoricalClassification.generate_labels-521"><a href="#CategoricalClassification.generate_labels-521"><span class="linenos">521</span></a>                <span class="s1">&#39;class_relation&#39;</span><span class="p">:</span> <span class="n">class_relation</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-522"><a href="#CategoricalClassification.generate_labels-522"><span class="linenos">522</span></a>                <span class="s1">&#39;n_class&#39;</span><span class="p">:</span> <span class="n">n</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-523"><a href="#CategoricalClassification.generate_labels-523"><span class="linenos">523</span></a>            <span class="p">},</span>
+</span><span id="CategoricalClassification.generate_labels-524"><a href="#CategoricalClassification.generate_labels-524"><span class="linenos">524</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification.generate_labels-525"><a href="#CategoricalClassification.generate_labels-525"><span class="linenos">525</span></a>
+</span><span id="CategoricalClassification.generate_labels-526"><a href="#CategoricalClassification.generate_labels-526"><span class="linenos">526</span></a>        <span class="k">return</span> <span class="n">y</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Generates labels for dataset X</p>
+
+<h6 id="parameters">Parameters</h6>
+
+<ul>
+<li><strong>X</strong>:  dataset</li>
+<li><strong>n</strong>:  number of class labels</li>
+<li><strong>p</strong>:  class distribution</li>
+<li><strong>k</strong>:  constant</li>
+<li><strong>decision_function</strong>:  optional user-defined decision function</li>
+<li><strong>class_relation</strong>:  string, either 'linear', 'nonlinear', or 'cluster'</li>
+<li><strong>balance</strong>:  boolean, whether to balance clustering class labels</li>
+</ul>
+
+<h6 id="returns">Returns</h6>
+
+<blockquote>
+  <p>array of labels, corresponding to dataset X</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="CategoricalClassification.generate_noise" class="classattr">
+                                        <input id="CategoricalClassification.generate_noise-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">generate_noise</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">X</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">y</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.2</span>,</span><span class="param">	<span class="nb">type</span><span class="p">:</span> <span class="n">Literal</span> <span class="o">=</span> <span class="s1">&#39;categorical&#39;</span>,</span><span class="param">	<span class="n">missing_val</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="o">-</span><span class="n">inf</span></span><span class="return-annotation">) -> <span class="n">numpy</span><span class="o">.</span><span class="n">ndarray</span>:</span></span>
+
+                <label class="view-source-button" for="CategoricalClassification.generate_noise-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#CategoricalClassification.generate_noise"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_noise-624"><a href="#CategoricalClassification.generate_noise-624"><span class="linenos">624</span></a>    <span class="k">def</span> <span class="nf">generate_noise</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_noise-625"><a href="#CategoricalClassification.generate_noise-625"><span class="linenos">625</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_noise-626"><a href="#CategoricalClassification.generate_noise-626"><span class="linenos">626</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_noise-627"><a href="#CategoricalClassification.generate_noise-627"><span class="linenos">627</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_noise-628"><a href="#CategoricalClassification.generate_noise-628"><span class="linenos">628</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.2</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_noise-629"><a href="#CategoricalClassification.generate_noise-629"><span class="linenos">629</span></a>        <span class="nb">type</span><span class="p">:</span> <span class="n">Literal</span> <span class="o">=</span> <span class="s1">&#39;categorical&#39;</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_noise-630"><a href="#CategoricalClassification.generate_noise-630"><span class="linenos">630</span></a>        <span class="n">missing_val</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;-inf&#39;</span><span class="p">),</span>
+</span><span id="CategoricalClassification.generate_noise-631"><a href="#CategoricalClassification.generate_noise-631"><span class="linenos">631</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-632"><a href="#CategoricalClassification.generate_noise-632"><span class="linenos">632</span></a>
+</span><span id="CategoricalClassification.generate_noise-633"><a href="#CategoricalClassification.generate_noise-633"><span class="linenos">633</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_noise-634"><a href="#CategoricalClassification.generate_noise-634"><span class="linenos">634</span></a><span class="sd">        Simulates noise on given dataset X</span>
+</span><span id="CategoricalClassification.generate_noise-635"><a href="#CategoricalClassification.generate_noise-635"><span class="linenos">635</span></a><span class="sd">        :param X: dataset to apply noise to</span>
+</span><span id="CategoricalClassification.generate_noise-636"><a href="#CategoricalClassification.generate_noise-636"><span class="linenos">636</span></a><span class="sd">        :param y: required target labels for categorical noise generation</span>
+</span><span id="CategoricalClassification.generate_noise-637"><a href="#CategoricalClassification.generate_noise-637"><span class="linenos">637</span></a><span class="sd">        :param p: amount of noise to apply. Defaults to 0.2</span>
+</span><span id="CategoricalClassification.generate_noise-638"><a href="#CategoricalClassification.generate_noise-638"><span class="linenos">638</span></a><span class="sd">        :param type: type of noise to apply, either categorical or missing</span>
+</span><span id="CategoricalClassification.generate_noise-639"><a href="#CategoricalClassification.generate_noise-639"><span class="linenos">639</span></a><span class="sd">        :param missing_val: value to simulate missing values. Defaults to float(&#39;-inf&#39;)</span>
+</span><span id="CategoricalClassification.generate_noise-640"><a href="#CategoricalClassification.generate_noise-640"><span class="linenos">640</span></a><span class="sd">        :return: X with noise applied</span>
+</span><span id="CategoricalClassification.generate_noise-641"><a href="#CategoricalClassification.generate_noise-641"><span class="linenos">641</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_noise-642"><a href="#CategoricalClassification.generate_noise-642"><span class="linenos">642</span></a>
+</span><span id="CategoricalClassification.generate_noise-643"><a href="#CategoricalClassification.generate_noise-643"><span class="linenos">643</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="CategoricalClassification.generate_noise-644"><a href="#CategoricalClassification.generate_noise-644"><span class="linenos">644</span></a>            <span class="s1">&#39;type&#39;</span><span class="p">:</span> <span class="nb">type</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_noise-645"><a href="#CategoricalClassification.generate_noise-645"><span class="linenos">645</span></a>            <span class="s1">&#39;amount&#39;</span><span class="p">:</span> <span class="n">p</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_noise-646"><a href="#CategoricalClassification.generate_noise-646"><span class="linenos">646</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification.generate_noise-647"><a href="#CategoricalClassification.generate_noise-647"><span class="linenos">647</span></a>
+</span><span id="CategoricalClassification.generate_noise-648"><a href="#CategoricalClassification.generate_noise-648"><span class="linenos">648</span></a>        <span class="k">if</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;categorical&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-649"><a href="#CategoricalClassification.generate_noise-649"><span class="linenos">649</span></a>            <span class="n">label_values</span><span class="p">,</span> <span class="n">label_count</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-650"><a href="#CategoricalClassification.generate_noise-650"><span class="linenos">650</span></a>            <span class="n">n_labels</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">label_values</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-651"><a href="#CategoricalClassification.generate_noise-651"><span class="linenos">651</span></a>
+</span><span id="CategoricalClassification.generate_noise-652"><a href="#CategoricalClassification.generate_noise-652"><span class="linenos">652</span></a>            <span class="n">inds</span> <span class="o">=</span> <span class="n">y</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
+</span><span id="CategoricalClassification.generate_noise-653"><a href="#CategoricalClassification.generate_noise-653"><span class="linenos">653</span></a>            <span class="n">y_sort</span> <span class="o">=</span> <span class="n">y</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_noise-654"><a href="#CategoricalClassification.generate_noise-654"><span class="linenos">654</span></a>            <span class="n">X_sort</span> <span class="o">=</span> <span class="n">X</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_noise-655"><a href="#CategoricalClassification.generate_noise-655"><span class="linenos">655</span></a>
+</span><span id="CategoricalClassification.generate_noise-656"><a href="#CategoricalClassification.generate_noise-656"><span class="linenos">656</span></a>            <span class="n">Xs_T</span> <span class="o">=</span> <span class="n">X_sort</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification.generate_noise-657"><a href="#CategoricalClassification.generate_noise-657"><span class="linenos">657</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_noise-658"><a href="#CategoricalClassification.generate_noise-658"><span class="linenos">658</span></a>            <span class="n">n_flip</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-659"><a href="#CategoricalClassification.generate_noise-659"><span class="linenos">659</span></a>
+</span><span id="CategoricalClassification.generate_noise-660"><a href="#CategoricalClassification.generate_noise-660"><span class="linenos">660</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xs_T</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-661"><a href="#CategoricalClassification.generate_noise-661"><span class="linenos">661</span></a>                <span class="n">unique_per_label</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="CategoricalClassification.generate_noise-662"><a href="#CategoricalClassification.generate_noise-662"><span class="linenos">662</span></a>
+</span><span id="CategoricalClassification.generate_noise-663"><a href="#CategoricalClassification.generate_noise-663"><span class="linenos">663</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_labels</span><span class="p">):</span>
+</span><span id="CategoricalClassification.generate_noise-664"><a href="#CategoricalClassification.generate_noise-664"><span class="linenos">664</span></a>                    <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-665"><a href="#CategoricalClassification.generate_noise-665"><span class="linenos">665</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]])</span>
+</span><span id="CategoricalClassification.generate_noise-666"><a href="#CategoricalClassification.generate_noise-666"><span class="linenos">666</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-667"><a href="#CategoricalClassification.generate_noise-667"><span class="linenos">667</span></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-668"><a href="#CategoricalClassification.generate_noise-668"><span class="linenos">668</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">-</span> <span class="mi">1</span><span class="p">])</span>
+</span><span id="CategoricalClassification.generate_noise-669"><a href="#CategoricalClassification.generate_noise-669"><span class="linenos">669</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-670"><a href="#CategoricalClassification.generate_noise-670"><span class="linenos">670</span></a>
+</span><span id="CategoricalClassification.generate_noise-671"><a href="#CategoricalClassification.generate_noise-671"><span class="linenos">671</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_flip</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-672"><a href="#CategoricalClassification.generate_noise-672"><span class="linenos">672</span></a>
+</span><span id="CategoricalClassification.generate_noise-673"><a href="#CategoricalClassification.generate_noise-673"><span class="linenos">673</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-674"><a href="#CategoricalClassification.generate_noise-674"><span class="linenos">674</span></a>                    <span class="n">current_label</span> <span class="o">=</span> <span class="n">y_sort</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_noise-675"><a href="#CategoricalClassification.generate_noise-675"><span class="linenos">675</span></a>                    <span class="n">possible_labels</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">label_values</span> <span class="o">!=</span> <span class="n">current_label</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_noise-676"><a href="#CategoricalClassification.generate_noise-676"><span class="linenos">676</span></a>
+</span><span id="CategoricalClassification.generate_noise-677"><a href="#CategoricalClassification.generate_noise-677"><span class="linenos">677</span></a>                    <span class="c1"># find all unique values from labels != current label</span>
+</span><span id="CategoricalClassification.generate_noise-678"><a href="#CategoricalClassification.generate_noise-678"><span class="linenos">678</span></a>                    <span class="n">values</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span>
+</span><span id="CategoricalClassification.generate_noise-679"><a href="#CategoricalClassification.generate_noise-679"><span class="linenos">679</span></a>                    <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">possible_labels</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-680"><a href="#CategoricalClassification.generate_noise-680"><span class="linenos">680</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">values</span><span class="o">.</span><span class="n">union</span><span class="p">(</span><span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">])</span>
+</span><span id="CategoricalClassification.generate_noise-681"><a href="#CategoricalClassification.generate_noise-681"><span class="linenos">681</span></a>
+</span><span id="CategoricalClassification.generate_noise-682"><a href="#CategoricalClassification.generate_noise-682"><span class="linenos">682</span></a>                    <span class="c1"># remove any overlapping values, ensuring replacement values are unique &amp; from a target label !=</span>
+</span><span id="CategoricalClassification.generate_noise-683"><a href="#CategoricalClassification.generate_noise-683"><span class="linenos">683</span></a>                    <span class="c1"># current label</span>
+</span><span id="CategoricalClassification.generate_noise-684"><a href="#CategoricalClassification.generate_noise-684"><span class="linenos">684</span></a>                    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">current_label</span><span class="p">]</span> <span class="o">&amp;</span> <span class="n">values</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-685"><a href="#CategoricalClassification.generate_noise-685"><span class="linenos">685</span></a>                        <span class="n">values</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">val</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-686"><a href="#CategoricalClassification.generate_noise-686"><span class="linenos">686</span></a>
+</span><span id="CategoricalClassification.generate_noise-687"><a href="#CategoricalClassification.generate_noise-687"><span class="linenos">687</span></a>                    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">values</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-688"><a href="#CategoricalClassification.generate_noise-688"><span class="linenos">688</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_noise-689"><a href="#CategoricalClassification.generate_noise-689"><span class="linenos">689</span></a>
+</span><span id="CategoricalClassification.generate_noise-690"><a href="#CategoricalClassification.generate_noise-690"><span class="linenos">690</span></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-691"><a href="#CategoricalClassification.generate_noise-691"><span class="linenos">691</span></a>                        <span class="n">key</span> <span class="o">=</span> <span class="n">possible_labels</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">possible_labels</span><span class="p">))]</span>
+</span><span id="CategoricalClassification.generate_noise-692"><a href="#CategoricalClassification.generate_noise-692"><span class="linenos">692</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_noise-693"><a href="#CategoricalClassification.generate_noise-693"><span class="linenos">693</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_noise-694"><a href="#CategoricalClassification.generate_noise-694"><span class="linenos">694</span></a>
+</span><span id="CategoricalClassification.generate_noise-695"><a href="#CategoricalClassification.generate_noise-695"><span class="linenos">695</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">val</span>
+</span><span id="CategoricalClassification.generate_noise-696"><a href="#CategoricalClassification.generate_noise-696"><span class="linenos">696</span></a>
+</span><span id="CategoricalClassification.generate_noise-697"><a href="#CategoricalClassification.generate_noise-697"><span class="linenos">697</span></a>            <span class="n">rev_ind</span> <span class="o">=</span> <span class="n">inds</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
+</span><span id="CategoricalClassification.generate_noise-698"><a href="#CategoricalClassification.generate_noise-698"><span class="linenos">698</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification.generate_noise-699"><a href="#CategoricalClassification.generate_noise-699"><span class="linenos">699</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">X_noise</span><span class="p">[</span><span class="n">rev_ind</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_noise-700"><a href="#CategoricalClassification.generate_noise-700"><span class="linenos">700</span></a>
+</span><span id="CategoricalClassification.generate_noise-701"><a href="#CategoricalClassification.generate_noise-701"><span class="linenos">701</span></a>            <span class="k">return</span> <span class="n">X_noise</span>
+</span><span id="CategoricalClassification.generate_noise-702"><a href="#CategoricalClassification.generate_noise-702"><span class="linenos">702</span></a>
+</span><span id="CategoricalClassification.generate_noise-703"><a href="#CategoricalClassification.generate_noise-703"><span class="linenos">703</span></a>        <span class="k">elif</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;missing&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-704"><a href="#CategoricalClassification.generate_noise-704"><span class="linenos">704</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-705"><a href="#CategoricalClassification.generate_noise-705"><span class="linenos">705</span></a>            <span class="n">Xn_T</span> <span class="o">=</span> <span class="n">X_noise</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification.generate_noise-706"><a href="#CategoricalClassification.generate_noise-706"><span class="linenos">706</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_noise-707"><a href="#CategoricalClassification.generate_noise-707"><span class="linenos">707</span></a>            <span class="n">n_missing</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-708"><a href="#CategoricalClassification.generate_noise-708"><span class="linenos">708</span></a>            <span class="c1">#print(&quot;n to delete:&quot;, n_missing)</span>
+</span><span id="CategoricalClassification.generate_noise-709"><a href="#CategoricalClassification.generate_noise-709"><span class="linenos">709</span></a>
+</span><span id="CategoricalClassification.generate_noise-710"><a href="#CategoricalClassification.generate_noise-710"><span class="linenos">710</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xn_T</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-711"><a href="#CategoricalClassification.generate_noise-711"><span class="linenos">711</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_missing</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-712"><a href="#CategoricalClassification.generate_noise-712"><span class="linenos">712</span></a>
+</span><span id="CategoricalClassification.generate_noise-713"><a href="#CategoricalClassification.generate_noise-713"><span class="linenos">713</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-714"><a href="#CategoricalClassification.generate_noise-714"><span class="linenos">714</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">missing_val</span>
+</span><span id="CategoricalClassification.generate_noise-715"><a href="#CategoricalClassification.generate_noise-715"><span class="linenos">715</span></a>
+</span><span id="CategoricalClassification.generate_noise-716"><a href="#CategoricalClassification.generate_noise-716"><span class="linenos">716</span></a>            <span class="k">return</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">T</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Simulates noise on given dataset X</p>
+
+<h6 id="parameters">Parameters</h6>
+
+<ul>
+<li><strong>X</strong>:  dataset to apply noise to</li>
+<li><strong>y</strong>:  required target labels for categorical noise generation</li>
+<li><strong>p</strong>:  amount of noise to apply. Defaults to 0.2</li>
+<li><strong>type</strong>:  type of noise to apply, either categorical or missing</li>
+<li><strong>missing_val</strong>:  value to simulate missing values. Defaults to float('-inf')</li>
+</ul>
+
+<h6 id="returns">Returns</h6>
+
+<blockquote>
+  <p>X with noise applied</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="CategoricalClassification.downsample_dataset" class="classattr">
+                                        <input id="CategoricalClassification.downsample_dataset-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">downsample_dataset</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">X</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">y</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">N</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span>,</span><span class="param">	<span class="n">reshuffle</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span></span><span class="return-annotation">) -> <span class="nb">tuple</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">ndarray</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="CategoricalClassification.downsample_dataset-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#CategoricalClassification.downsample_dataset"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.downsample_dataset-718"><a href="#CategoricalClassification.downsample_dataset-718"><span class="linenos">718</span></a>    <span class="k">def</span> <span class="nf">downsample_dataset</span><span class="p">(</span>
+</span><span id="CategoricalClassification.downsample_dataset-719"><a href="#CategoricalClassification.downsample_dataset-719"><span class="linenos">719</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-720"><a href="#CategoricalClassification.downsample_dataset-720"><span class="linenos">720</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-721"><a href="#CategoricalClassification.downsample_dataset-721"><span class="linenos">721</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-722"><a href="#CategoricalClassification.downsample_dataset-722"><span class="linenos">722</span></a>        <span class="n">N</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-723"><a href="#CategoricalClassification.downsample_dataset-723"><span class="linenos">723</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-724"><a href="#CategoricalClassification.downsample_dataset-724"><span class="linenos">724</span></a>        <span class="n">reshuffle</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-725"><a href="#CategoricalClassification.downsample_dataset-725"><span class="linenos">725</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">]:</span>
+</span><span id="CategoricalClassification.downsample_dataset-726"><a href="#CategoricalClassification.downsample_dataset-726"><span class="linenos">726</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-727"><a href="#CategoricalClassification.downsample_dataset-727"><span class="linenos">727</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.downsample_dataset-728"><a href="#CategoricalClassification.downsample_dataset-728"><span class="linenos">728</span></a><span class="sd">        Downsamples dataset X according to N or the number of samples in minority class, resulting in a balanced dataset.</span>
+</span><span id="CategoricalClassification.downsample_dataset-729"><a href="#CategoricalClassification.downsample_dataset-729"><span class="linenos">729</span></a><span class="sd">        :param X: Dataset to downsample</span>
+</span><span id="CategoricalClassification.downsample_dataset-730"><a href="#CategoricalClassification.downsample_dataset-730"><span class="linenos">730</span></a><span class="sd">        :param y: Labels corresponding to X</span>
+</span><span id="CategoricalClassification.downsample_dataset-731"><a href="#CategoricalClassification.downsample_dataset-731"><span class="linenos">731</span></a><span class="sd">        :param N: Optional number of samples per class to downsample to</span>
+</span><span id="CategoricalClassification.downsample_dataset-732"><a href="#CategoricalClassification.downsample_dataset-732"><span class="linenos">732</span></a><span class="sd">        :param seed: Seed for random state of resample function</span>
+</span><span id="CategoricalClassification.downsample_dataset-733"><a href="#CategoricalClassification.downsample_dataset-733"><span class="linenos">733</span></a><span class="sd">        :param reshuffle: Reshuffle the dataset after downsampling</span>
+</span><span id="CategoricalClassification.downsample_dataset-734"><a href="#CategoricalClassification.downsample_dataset-734"><span class="linenos">734</span></a><span class="sd">        :return: Balanced X and y after downsampling</span>
+</span><span id="CategoricalClassification.downsample_dataset-735"><a href="#CategoricalClassification.downsample_dataset-735"><span class="linenos">735</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.downsample_dataset-736"><a href="#CategoricalClassification.downsample_dataset-736"><span class="linenos">736</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-737"><a href="#CategoricalClassification.downsample_dataset-737"><span class="linenos">737</span></a>        <span class="n">original_shape</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification.downsample_dataset-738"><a href="#CategoricalClassification.downsample_dataset-738"><span class="linenos">738</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-739"><a href="#CategoricalClassification.downsample_dataset-739"><span class="linenos">739</span></a>        <span class="n">values</span><span class="p">,</span> <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="CategoricalClassification.downsample_dataset-740"><a href="#CategoricalClassification.downsample_dataset-740"><span class="linenos">740</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification.downsample_dataset-741"><a href="#CategoricalClassification.downsample_dataset-741"><span class="linenos">741</span></a>            <span class="n">N</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">)</span>
+</span><span id="CategoricalClassification.downsample_dataset-742"><a href="#CategoricalClassification.downsample_dataset-742"><span class="linenos">742</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-743"><a href="#CategoricalClassification.downsample_dataset-743"><span class="linenos">743</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="o">&gt;</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">):</span>
+</span><span id="CategoricalClassification.downsample_dataset-744"><a href="#CategoricalClassification.downsample_dataset-744"><span class="linenos">744</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;N must be equal to or less than the number of samples in minority class&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.downsample_dataset-745"><a href="#CategoricalClassification.downsample_dataset-745"><span class="linenos">745</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-746"><a href="#CategoricalClassification.downsample_dataset-746"><span class="linenos">746</span></a>        <span class="n">X_arrays_list</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification.downsample_dataset-747"><a href="#CategoricalClassification.downsample_dataset-747"><span class="linenos">747</span></a>        <span class="n">y_downsampled</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification.downsample_dataset-748"><a href="#CategoricalClassification.downsample_dataset-748"><span class="linenos">748</span></a>        <span class="k">for</span> <span class="n">label</span> <span class="ow">in</span> <span class="n">values</span><span class="p">:</span>
+</span><span id="CategoricalClassification.downsample_dataset-749"><a href="#CategoricalClassification.downsample_dataset-749"><span class="linenos">749</span></a>            <span class="n">X_label</span> <span class="o">=</span> <span class="p">[</span><span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">y</span><span class="p">))</span> <span class="k">if</span> <span class="n">y</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">==</span> <span class="n">label</span><span class="p">]</span>
+</span><span id="CategoricalClassification.downsample_dataset-750"><a href="#CategoricalClassification.downsample_dataset-750"><span class="linenos">750</span></a>            <span class="n">X_label_downsample</span> <span class="o">=</span> <span class="n">resample</span><span class="p">(</span>
+</span><span id="CategoricalClassification.downsample_dataset-751"><a href="#CategoricalClassification.downsample_dataset-751"><span class="linenos">751</span></a>                <span class="n">X_label</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-752"><a href="#CategoricalClassification.downsample_dataset-752"><span class="linenos">752</span></a>                <span class="n">replace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-753"><a href="#CategoricalClassification.downsample_dataset-753"><span class="linenos">753</span></a>                <span class="n">n_samples</span><span class="o">=</span><span class="n">N</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-754"><a href="#CategoricalClassification.downsample_dataset-754"><span class="linenos">754</span></a>                <span class="n">random_state</span><span class="o">=</span><span class="n">seed</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-755"><a href="#CategoricalClassification.downsample_dataset-755"><span class="linenos">755</span></a>            <span class="p">)</span>
+</span><span id="CategoricalClassification.downsample_dataset-756"><a href="#CategoricalClassification.downsample_dataset-756"><span class="linenos">756</span></a>            <span class="n">X_arrays_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">X_label_downsample</span><span class="p">)</span>
+</span><span id="CategoricalClassification.downsample_dataset-757"><a href="#CategoricalClassification.downsample_dataset-757"><span class="linenos">757</span></a>            <span class="n">ys</span> <span class="o">=</span> <span class="p">[</span><span class="n">label</span><span class="p">]</span> <span class="o">*</span> <span class="n">N</span>
+</span><span id="CategoricalClassification.downsample_dataset-758"><a href="#CategoricalClassification.downsample_dataset-758"><span class="linenos">758</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">y_downsampled</span><span class="p">,</span> <span class="n">ys</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification.downsample_dataset-759"><a href="#CategoricalClassification.downsample_dataset-759"><span class="linenos">759</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-760"><a href="#CategoricalClassification.downsample_dataset-760"><span class="linenos">760</span></a>        <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">X_arrays_list</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification.downsample_dataset-761"><a href="#CategoricalClassification.downsample_dataset-761"><span class="linenos">761</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-762"><a href="#CategoricalClassification.downsample_dataset-762"><span class="linenos">762</span></a>        <span class="k">if</span> <span class="n">reshuffle</span><span class="p">:</span>
+</span><span id="CategoricalClassification.downsample_dataset-763"><a href="#CategoricalClassification.downsample_dataset-763"><span class="linenos">763</span></a>            <span class="n">indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X_downsampled</span><span class="p">))</span>
+</span><span id="CategoricalClassification.downsample_dataset-764"><a href="#CategoricalClassification.downsample_dataset-764"><span class="linenos">764</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">indices</span><span class="p">)</span>
+</span><span id="CategoricalClassification.downsample_dataset-765"><a href="#CategoricalClassification.downsample_dataset-765"><span class="linenos">765</span></a>            <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification.downsample_dataset-766"><a href="#CategoricalClassification.downsample_dataset-766"><span class="linenos">766</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">y_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification.downsample_dataset-767"><a href="#CategoricalClassification.downsample_dataset-767"><span class="linenos">767</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-768"><a href="#CategoricalClassification.downsample_dataset-768"><span class="linenos">768</span></a>        <span class="n">downsampled_shape</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification.downsample_dataset-769"><a href="#CategoricalClassification.downsample_dataset-769"><span class="linenos">769</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-770"><a href="#CategoricalClassification.downsample_dataset-770"><span class="linenos">770</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="CategoricalClassification.downsample_dataset-771"><a href="#CategoricalClassification.downsample_dataset-771"><span class="linenos">771</span></a>            <span class="s1">&#39;downsampling&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="CategoricalClassification.downsample_dataset-772"><a href="#CategoricalClassification.downsample_dataset-772"><span class="linenos">772</span></a>                <span class="s1">&#39;original_shape&#39;</span><span class="p">:</span> <span class="n">original_shape</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-773"><a href="#CategoricalClassification.downsample_dataset-773"><span class="linenos">773</span></a>                <span class="s1">&#39;downsampled_shape&#39;</span><span class="p">:</span> <span class="n">downsampled_shape</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-774"><a href="#CategoricalClassification.downsample_dataset-774"><span class="linenos">774</span></a>            <span class="p">},</span>
+</span><span id="CategoricalClassification.downsample_dataset-775"><a href="#CategoricalClassification.downsample_dataset-775"><span class="linenos">775</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification.downsample_dataset-776"><a href="#CategoricalClassification.downsample_dataset-776"><span class="linenos">776</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-777"><a href="#CategoricalClassification.downsample_dataset-777"><span class="linenos">777</span></a>        <span class="k">return</span> <span class="n">X_downsampled</span><span class="p">,</span> <span class="n">y_downsampled</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Downsamples dataset X according to N or the number of samples in minority class, resulting in a balanced dataset.</p>
+
+<h6 id="parameters">Parameters</h6>
+
+<ul>
+<li><strong>X</strong>:  Dataset to downsample</li>
+<li><strong>y</strong>:  Labels corresponding to X</li>
+<li><strong>N</strong>:  Optional number of samples per class to downsample to</li>
+<li><strong>seed</strong>:  Seed for random state of resample function</li>
+<li><strong>reshuffle</strong>:  Reshuffle the dataset after downsampling</li>
+</ul>
+
+<h6 id="returns">Returns</h6>
+
+<blockquote>
+  <p>Balanced X and y after downsampling</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="CategoricalClassification.print_dataset" class="classattr">
+                                        <input id="CategoricalClassification.print_dataset-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">print_dataset</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">X</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">y</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span></span><span class="return-annotation">):</span></span>
+
+                <label class="view-source-button" for="CategoricalClassification.print_dataset-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#CategoricalClassification.print_dataset"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.print_dataset-779"><a href="#CategoricalClassification.print_dataset-779"><span class="linenos">779</span></a>    <span class="k">def</span> <span class="nf">print_dataset</span><span class="p">(</span>
+</span><span id="CategoricalClassification.print_dataset-780"><a href="#CategoricalClassification.print_dataset-780"><span class="linenos">780</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification.print_dataset-781"><a href="#CategoricalClassification.print_dataset-781"><span class="linenos">781</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.print_dataset-782"><a href="#CategoricalClassification.print_dataset-782"><span class="linenos">782</span></a>        <span class="n">y</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.print_dataset-783"><a href="#CategoricalClassification.print_dataset-783"><span class="linenos">783</span></a>    <span class="p">):</span>
+</span><span id="CategoricalClassification.print_dataset-784"><a href="#CategoricalClassification.print_dataset-784"><span class="linenos">784</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.print_dataset-785"><a href="#CategoricalClassification.print_dataset-785"><span class="linenos">785</span></a><span class="sd">        Prints given dataset</span>
+</span><span id="CategoricalClassification.print_dataset-786"><a href="#CategoricalClassification.print_dataset-786"><span class="linenos">786</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification.print_dataset-787"><a href="#CategoricalClassification.print_dataset-787"><span class="linenos">787</span></a><span class="sd">        :param y: labels</span>
+</span><span id="CategoricalClassification.print_dataset-788"><a href="#CategoricalClassification.print_dataset-788"><span class="linenos">788</span></a><span class="sd">        :return:</span>
+</span><span id="CategoricalClassification.print_dataset-789"><a href="#CategoricalClassification.print_dataset-789"><span class="linenos">789</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.print_dataset-790"><a href="#CategoricalClassification.print_dataset-790"><span class="linenos">790</span></a>
+</span><span id="CategoricalClassification.print_dataset-791"><a href="#CategoricalClassification.print_dataset-791"><span class="linenos">791</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification.print_dataset-792"><a href="#CategoricalClassification.print_dataset-792"><span class="linenos">792</span></a>        <span class="n">n</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="CategoricalClassification.print_dataset-793"><a href="#CategoricalClassification.print_dataset-793"><span class="linenos">793</span></a>        <span class="k">for</span> <span class="n">arr</span> <span class="ow">in</span> <span class="n">X</span><span class="p">:</span>
+</span><span id="CategoricalClassification.print_dataset-794"><a href="#CategoricalClassification.print_dataset-794"><span class="linenos">794</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;[&#39;</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.print_dataset-795"><a href="#CategoricalClassification.print_dataset-795"><span class="linenos">795</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
+</span><span id="CategoricalClassification.print_dataset-796"><a href="#CategoricalClassification.print_dataset-796"><span class="linenos">796</span></a>                <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="n">n_features</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="CategoricalClassification.print_dataset-797"><a href="#CategoricalClassification.print_dataset-797"><span class="linenos">797</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.print_dataset-798"><a href="#CategoricalClassification.print_dataset-798"><span class="linenos">798</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.print_dataset-799"><a href="#CategoricalClassification.print_dataset-799"><span class="linenos">799</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;, &#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.print_dataset-800"><a href="#CategoricalClassification.print_dataset-800"><span class="linenos">800</span></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;], Label: </span><span class="si">{</span><span class="n">y</span><span class="p">[</span><span class="n">n</span><span class="p">]</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.print_dataset-801"><a href="#CategoricalClassification.print_dataset-801"><span class="linenos">801</span></a>            <span class="n">n</span> <span class="o">+=</span> <span class="mi">1</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Prints given dataset</p>
+
+<h6 id="parameters">Parameters</h6>
+
+<ul>
+<li><strong>X</strong>:  dataset</li>
+<li><strong>y</strong>:  labels</li>
+</ul>
+
+<h6 id="returns">Returns</h6>
+</div>
+
+
+                            </div>
+                            <div id="CategoricalClassification.summarize" class="classattr">
+                                        <input id="CategoricalClassification.summarize-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">summarize</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span></span><span class="return-annotation">):</span></span>
+
+                <label class="view-source-button" for="CategoricalClassification.summarize-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#CategoricalClassification.summarize"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.summarize-803"><a href="#CategoricalClassification.summarize-803"><span class="linenos">803</span></a>    <span class="k">def</span> <span class="nf">summarize</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="CategoricalClassification.summarize-804"><a href="#CategoricalClassification.summarize-804"><span class="linenos">804</span></a>
+</span><span id="CategoricalClassification.summarize-805"><a href="#CategoricalClassification.summarize-805"><span class="linenos">805</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of features: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;general&#39;</span><span class="p">][</span><span class="s1">&#39;n_features&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-806"><a href="#CategoricalClassification.summarize-806"><span class="linenos">806</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of generated samples: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;general&#39;</span><span class="p">][</span><span class="s1">&#39;n_samples&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-807"><a href="#CategoricalClassification.summarize-807"><span class="linenos">807</span></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">]:</span>
+</span><span id="CategoricalClassification.summarize-808"><a href="#CategoricalClassification.summarize-808"><span class="linenos">808</span></a>            <span class="nb">print</span><span class="p">(</span>
+</span><span id="CategoricalClassification.summarize-809"><a href="#CategoricalClassification.summarize-809"><span class="linenos">809</span></a>                <span class="sa">f</span><span class="s2">&quot;Dataset downsampled from shape </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">][</span><span class="s1">&#39;original_shape&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">, to shape </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">][</span><span class="s1">&#39;downsampled_shape&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="CategoricalClassification.summarize-810"><a href="#CategoricalClassification.summarize-810"><span class="linenos">810</span></a>            <span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-811"><a href="#CategoricalClassification.summarize-811"><span class="linenos">811</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of classes: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;labels&#39;</span><span class="p">][</span><span class="s1">&#39;n_class&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-812"><a href="#CategoricalClassification.summarize-812"><span class="linenos">812</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Class relation: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;labels&#39;</span><span class="p">][</span><span class="s1">&#39;class_relation&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-813"><a href="#CategoricalClassification.summarize-813"><span class="linenos">813</span></a>
+</span><span id="CategoricalClassification.summarize-814"><a href="#CategoricalClassification.summarize-814"><span class="linenos">814</span></a>        <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-815"><a href="#CategoricalClassification.summarize-815"><span class="linenos">815</span></a>
+</span><span id="CategoricalClassification.summarize-816"><a href="#CategoricalClassification.summarize-816"><span class="linenos">816</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification.summarize-817"><a href="#CategoricalClassification.summarize-817"><span class="linenos">817</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Combinations:&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-818"><a href="#CategoricalClassification.summarize-818"><span class="linenos">818</span></a>            <span class="k">for</span> <span class="n">comb</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">]:</span>
+</span><span id="CategoricalClassification.summarize-819"><a href="#CategoricalClassification.summarize-819"><span class="linenos">819</span></a>                <span class="nb">print</span><span class="p">(</span>
+</span><span id="CategoricalClassification.summarize-820"><a href="#CategoricalClassification.summarize-820"><span class="linenos">820</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are in </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;combination_type&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> combination, result in </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;combination_ix&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="CategoricalClassification.summarize-821"><a href="#CategoricalClassification.summarize-821"><span class="linenos">821</span></a>                <span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-822"><a href="#CategoricalClassification.summarize-822"><span class="linenos">822</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-823"><a href="#CategoricalClassification.summarize-823"><span class="linenos">823</span></a>
+</span><span id="CategoricalClassification.summarize-824"><a href="#CategoricalClassification.summarize-824"><span class="linenos">824</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification.summarize-825"><a href="#CategoricalClassification.summarize-825"><span class="linenos">825</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Correlations:&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-826"><a href="#CategoricalClassification.summarize-826"><span class="linenos">826</span></a>            <span class="k">for</span> <span class="n">corr</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">]:</span>
+</span><span id="CategoricalClassification.summarize-827"><a href="#CategoricalClassification.summarize-827"><span class="linenos">827</span></a>                <span class="nb">print</span><span class="p">(</span>
+</span><span id="CategoricalClassification.summarize-828"><a href="#CategoricalClassification.summarize-828"><span class="linenos">828</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are correlated to </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;correlated_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> with a factor of </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;correlation_factor&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="CategoricalClassification.summarize-829"><a href="#CategoricalClassification.summarize-829"><span class="linenos">829</span></a>                <span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-830"><a href="#CategoricalClassification.summarize-830"><span class="linenos">830</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-831"><a href="#CategoricalClassification.summarize-831"><span class="linenos">831</span></a>
+</span><span id="CategoricalClassification.summarize-832"><a href="#CategoricalClassification.summarize-832"><span class="linenos">832</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification.summarize-833"><a href="#CategoricalClassification.summarize-833"><span class="linenos">833</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Duplicates:&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-834"><a href="#CategoricalClassification.summarize-834"><span class="linenos">834</span></a>            <span class="k">for</span> <span class="n">dup</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">]:</span>
+</span><span id="CategoricalClassification.summarize-835"><a href="#CategoricalClassification.summarize-835"><span class="linenos">835</span></a>                <span class="nb">print</span><span class="p">(</span>
+</span><span id="CategoricalClassification.summarize-836"><a href="#CategoricalClassification.summarize-836"><span class="linenos">836</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">dup</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are duplicated, duplicate indexes are </span><span class="si">{</span><span class="n">dup</span><span class="p">[</span><span class="s1">&#39;duplicate_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="CategoricalClassification.summarize-837"><a href="#CategoricalClassification.summarize-837"><span class="linenos">837</span></a>                <span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-838"><a href="#CategoricalClassification.summarize-838"><span class="linenos">838</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-839"><a href="#CategoricalClassification.summarize-839"><span class="linenos">839</span></a>
+</span><span id="CategoricalClassification.summarize-840"><a href="#CategoricalClassification.summarize-840"><span class="linenos">840</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification.summarize-841"><a href="#CategoricalClassification.summarize-841"><span class="linenos">841</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Simulated noise:&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-842"><a href="#CategoricalClassification.summarize-842"><span class="linenos">842</span></a>            <span class="k">for</span> <span class="n">noise</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">]:</span>
+</span><span id="CategoricalClassification.summarize-843"><a href="#CategoricalClassification.summarize-843"><span class="linenos">843</span></a>                <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Simulated </span><span class="si">{</span><span class="n">noise</span><span class="p">[</span><span class="s1">&#39;type&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> noise, amount of </span><span class="si">{</span><span class="n">noise</span><span class="p">[</span><span class="s1">&#39;noise_amount&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-844"><a href="#CategoricalClassification.summarize-844"><span class="linenos">844</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.summarize-845"><a href="#CategoricalClassification.summarize-845"><span class="linenos">845</span></a>
+</span><span id="CategoricalClassification.summarize-846"><a href="#CategoricalClassification.summarize-846"><span class="linenos">846</span></a>        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\n</span><span class="s2">For more information on dataset structure, print cc.dataset_info[&#39;general&#39;][&#39;structure&#39;]&quot;</span><span class="p">)</span>
+</span></pre></div>
+
+
+    
+
+                            </div>
+                </section>
+    </main>
+<script>
+    function escapeHTML(html) {
+        return document.createElement('div').appendChild(document.createTextNode(html)).parentNode.innerHTML;
+    }
+
+    const originalContent = document.querySelector("main.pdoc");
+    let currentContent = originalContent;
+
+    function setContent(innerHTML) {
+        let elem;
+        if (innerHTML) {
+            elem = document.createElement("main");
+            elem.classList.add("pdoc");
+            elem.innerHTML = innerHTML;
+        } else {
+            elem = originalContent;
+        }
+        if (currentContent !== elem) {
+            currentContent.replaceWith(elem);
+            currentContent = elem;
+        }
+    }
+
+    function getSearchTerm() {
+        return (new URL(window.location)).searchParams.get("search");
+    }
+
+    const searchBox = document.querySelector(".pdoc input[type=search]");
+    searchBox.addEventListener("input", function () {
+        let url = new URL(window.location);
+        if (searchBox.value.trim()) {
+            url.hash = "";
+            url.searchParams.set("search", searchBox.value);
+        } else {
+            url.searchParams.delete("search");
+        }
+        history.replaceState("", "", url.toString());
+        onInput();
+    });
+    window.addEventListener("popstate", onInput);
+
+
+    let search, searchErr;
+
+    async function initialize() {
+        try {
+            search = await new Promise((resolve, reject) => {
+                const script = document.createElement("script");
+                script.type = "text/javascript";
+                script.async = true;
+                script.onload = () => resolve(window.pdocSearch);
+                script.onerror = (e) => reject(e);
+                script.src = "../../../search.js";
+                document.getElementsByTagName("head")[0].appendChild(script);
+            });
+        } catch (e) {
+            console.error("Cannot fetch pdoc search index");
+            searchErr = "Cannot fetch search index.";
+        }
+        onInput();
+
+        document.querySelector("nav.pdoc").addEventListener("click", e => {
+            if (e.target.hash) {
+                searchBox.value = "";
+                searchBox.dispatchEvent(new Event("input"));
+            }
+        });
+    }
+
+    function onInput() {
+        setContent((() => {
+            const term = getSearchTerm();
+            if (!term) {
+                return null
+            }
+            if (searchErr) {
+                return `<h3>Error: ${searchErr}</h3>`
+            }
+            if (!search) {
+                return "<h3>Searching...</h3>"
+            }
+
+            window.scrollTo({top: 0, left: 0, behavior: 'auto'});
+
+            const results = search(term);
+
+            let html;
+            if (results.length === 0) {
+                html = `No search results for '${escapeHTML(term)}'.`
+            } else {
+                html = `<h4>${results.length} search result${results.length > 1 ? "s" : ""} for '${escapeHTML(term)}'.</h4>`;
+            }
+            for (let result of results.slice(0, 10)) {
+                let doc = result.doc;
+                let url = `../../../${doc.modulename.replaceAll(".", "/")}.html`;
+                if (doc.qualname) {
+                    url += `#${doc.qualname}`;
+                }
+
+                let heading;
+                switch (result.doc.kind) {
+                    case "function":
+                        if (doc.fullname.endsWith(".__init__")) {
+                            heading = `<span class="name">${doc.fullname.replace(/\.__init__$/, "")}</span>${doc.signature}`;
+                        } else {
+                            heading = `<span class="def">${doc.funcdef}</span> <span class="name">${doc.fullname}</span>${doc.signature}`;
+                        }
+                        break;
+                    case "class":
+                        heading = `<span class="def">class</span> <span class="name">${doc.fullname}</span>`;
+                        if (doc.bases)
+                            heading += `<wbr>(<span class="base">${doc.bases}</span>)`;
+                        heading += `:`;
+                        break;
+                    case "variable":
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        if (doc.annotation)
+                            heading += `<span class="annotation">${doc.annotation}</span>`;
+                        if (doc.default_value)
+                            heading += `<span class="default_value"> = ${doc.default_value}</span>`;
+                        break;
+                    default:
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        break;
+                }
+                html += `
+                        <section class="search-result">
+                        <a href="${url}" class="attr ${doc.kind}">${heading}</a>
+                        <div class="docstring">${doc.doc}</div>
+                        </section>
+                    `;
+
+            }
+            return html;
+        })());
+    }
+
+    if (getSearchTerm()) {
+        initialize();
+        searchBox.value = getSearchTerm();
+        onInput();
+    } else {
+        searchBox.addEventListener("focus", initialize, {once: true});
+    }
+
+    searchBox.addEventListener("keydown", e => {
+        if (["ArrowDown", "ArrowUp", "Enter"].includes(e.key)) {
+            let focused = currentContent.querySelector(".search-result.focused");
+            if (!focused) {
+                currentContent.querySelector(".search-result").classList.add("focused");
+            } else if (
+                e.key === "ArrowDown"
+                && focused.nextElementSibling
+                && focused.nextElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.nextElementSibling.classList.add("focused");
+                focused.nextElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "ArrowUp"
+                && focused.previousElementSibling
+                && focused.previousElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.previousElementSibling.classList.add("focused");
+                focused.previousElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "Enter"
+            ) {
+                focused.querySelector("a").click();
+            }
+        }
+    });
+</script></body>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/algorithms/synthetic_data_generators/generator_naive.html b/docs/outrank/algorithms/synthetic_data_generators/generator_naive.html
index cf1042c..f01beca 100644
--- a/docs/outrank/algorithms/synthetic_data_generators/generator_naive.html
+++ b/docs/outrank/algorithms/synthetic_data_generators/generator_naive.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.algorithms.synthetic_data_generators.generator_naive API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -49,7 +49,7 @@ <h2>API Documentation</h2>
                     <h1 class="modulename">
 <a href="./../../../outrank.html">outrank</a><wbr>.<a href="./../../algorithms.html">algorithms</a><wbr>.<a href="./../synthetic_data_generators.html">synthetic_data_generators</a><wbr>.generator_naive    </h1>
 
-
+                
                         <input id="mod-generator_naive-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 
                         <label class="view-source-button" for="mod-generator_naive-view-source"><span>View Source</span></label>
@@ -69,63 +69,64 @@ <h1 class="modulename">
 </span><span id="L-13"><a href="#L-13"><span class="linenos">13</span></a>    <span class="n">target</span> <span class="o">=</span> <span class="n">sample</span><span class="p">[:,</span> <span class="mi">30</span><span class="p">]</span>
 </span><span id="L-14"><a href="#L-14"><span class="linenos">14</span></a>    <span class="c1"># Some noise</span>
 </span><span id="L-15"><a href="#L-15"><span class="linenos">15</span></a>
-</span><span id="L-16"><a href="#L-16"><span class="linenos">16</span></a>    <span class="n">target</span><span class="p">[</span><span class="n">target</span> <span class="o">&lt;</span> <span class="mi">20</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="L-17"><a href="#L-17"><span class="linenos">17</span></a>    <span class="k">return</span> <span class="n">sample</span><span class="p">,</span> <span class="n">target</span>
-</span><span id="L-18"><a href="#L-18"><span class="linenos">18</span></a>
+</span><span id="L-16"><a href="#L-16"><span class="linenos">16</span></a>    <span class="n">target</span><span class="p">[</span><span class="n">target</span> <span class="o">&lt;</span> <span class="mi">40</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-17"><a href="#L-17"><span class="linenos">17</span></a>    <span class="n">target</span><span class="p">[</span><span class="n">target</span> <span class="o">&gt;</span> <span class="mi">39</span><span class="p">]</span> <span class="o">=</span> <span class="mi">1</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos">18</span></a>    <span class="k">return</span> <span class="n">sample</span><span class="p">,</span> <span class="n">target</span>
 </span><span id="L-19"><a href="#L-19"><span class="linenos">19</span></a>
-</span><span id="L-20"><a href="#L-20"><span class="linenos">20</span></a><span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s1">&#39;__main__&#39;</span><span class="p">:</span>
-</span><span id="L-21"><a href="#L-21"><span class="linenos">21</span></a>    <span class="kn">import</span> <span class="nn">argparse</span>
-</span><span id="L-22"><a href="#L-22"><span class="linenos">22</span></a>    <span class="kn">import</span> <span class="nn">logging</span>
-</span><span id="L-23"><a href="#L-23"><span class="linenos">23</span></a>    <span class="kn">import</span> <span class="nn">os</span>
-</span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a>    <span class="kn">import</span> <span class="nn">shutil</span>
-</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a>
-</span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a>    <span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
-</span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a>
-</span><span id="L-28"><a href="#L-28"><span class="linenos">28</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">basicConfig</span><span class="p">(</span>
-</span><span id="L-29"><a href="#L-29"><span class="linenos">29</span></a>        <span class="nb">format</span><span class="o">=</span><span class="s1">&#39;</span><span class="si">%(asctime)s</span><span class="s1"> - </span><span class="si">%(message)s</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="L-30"><a href="#L-30"><span class="linenos">30</span></a>        <span class="n">datefmt</span><span class="o">=</span><span class="s1">&#39;</span><span class="si">%d</span><span class="s1">-%b-%y %H:%M:%S&#39;</span><span class="p">,</span>
-</span><span id="L-31"><a href="#L-31"><span class="linenos">31</span></a>    <span class="p">)</span>
-</span><span id="L-32"><a href="#L-32"><span class="linenos">32</span></a>    <span class="n">logger</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">getLogger</span><span class="p">(</span><span class="s1">&#39;syn-logger&#39;</span><span class="p">)</span>
-</span><span id="L-33"><a href="#L-33"><span class="linenos">33</span></a>    <span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
-</span><span id="L-34"><a href="#L-34"><span class="linenos">34</span></a>
-</span><span id="L-35"><a href="#L-35"><span class="linenos">35</span></a>    <span class="n">parser</span> <span class="o">=</span> <span class="n">argparse</span><span class="o">.</span><span class="n">ArgumentParser</span><span class="p">(</span>
-</span><span id="L-36"><a href="#L-36"><span class="linenos">36</span></a>        <span class="n">description</span><span class="o">=</span><span class="s1">&#39;Fast feature screening for sparse data sets.&#39;</span><span class="p">,</span>
-</span><span id="L-37"><a href="#L-37"><span class="linenos">37</span></a>        <span class="n">formatter_class</span><span class="o">=</span><span class="n">argparse</span><span class="o">.</span><span class="n">RawTextHelpFormatter</span><span class="p">,</span>
-</span><span id="L-38"><a href="#L-38"><span class="linenos">38</span></a>    <span class="p">)</span>
-</span><span id="L-39"><a href="#L-39"><span class="linenos">39</span></a>
-</span><span id="L-40"><a href="#L-40"><span class="linenos">40</span></a>    <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--output_df_name&#39;</span><span class="p">,</span> <span class="nb">type</span><span class="o">=</span><span class="nb">str</span><span class="p">,</span> <span class="n">default</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
-</span><span id="L-41"><a href="#L-41"><span class="linenos">41</span></a>
-</span><span id="L-42"><a href="#L-42"><span class="linenos">42</span></a>    <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--verify_outputs&#39;</span><span class="p">,</span> <span class="nb">type</span><span class="o">=</span><span class="nb">str</span><span class="p">,</span> <span class="n">default</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
-</span><span id="L-43"><a href="#L-43"><span class="linenos">43</span></a>
-</span><span id="L-44"><a href="#L-44"><span class="linenos">44</span></a>    <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--num_features&#39;</span><span class="p">,</span> <span class="nb">type</span><span class="o">=</span><span class="nb">int</span><span class="p">,</span> <span class="n">default</span><span class="o">=</span><span class="mi">300</span><span class="p">)</span>
-</span><span id="L-45"><a href="#L-45"><span class="linenos">45</span></a>
-</span><span id="L-46"><a href="#L-46"><span class="linenos">46</span></a>    <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--size&#39;</span><span class="p">,</span> <span class="nb">type</span><span class="o">=</span><span class="nb">int</span><span class="p">,</span> <span class="n">default</span><span class="o">=</span><span class="mi">1000</span><span class="p">)</span>
-</span><span id="L-47"><a href="#L-47"><span class="linenos">47</span></a>
-</span><span id="L-48"><a href="#L-48"><span class="linenos">48</span></a>    <span class="n">args</span> <span class="o">=</span> <span class="n">parser</span><span class="o">.</span><span class="n">parse_args</span><span class="p">()</span>
-</span><span id="L-49"><a href="#L-49"><span class="linenos">49</span></a>
-</span><span id="L-50"><a href="#L-50"><span class="linenos">50</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">output_df_name</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-51"><a href="#L-51"><span class="linenos">51</span></a>        <span class="n">sample</span><span class="p">,</span> <span class="n">target</span> <span class="o">=</span> <span class="n">generate_random_matrix</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">num_features</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">size</span><span class="p">)</span>
-</span><span id="L-52"><a href="#L-52"><span class="linenos">52</span></a>        <span class="n">dfx</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">sample</span><span class="p">)</span>
-</span><span id="L-53"><a href="#L-53"><span class="linenos">53</span></a>        <span class="n">dfx</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span><span class="sa">f</span><span class="s1">&#39;f</span><span class="si">{</span><span class="n">x</span><span class="si">}</span><span class="s1">&#39;</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">dfx</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">])]</span>
-</span><span id="L-54"><a href="#L-54"><span class="linenos">54</span></a>        <span class="n">dfx</span><span class="p">[</span><span class="s1">&#39;label&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">target</span>
-</span><span id="L-55"><a href="#L-55"><span class="linenos">55</span></a>        <span class="k">if</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">exists</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_df_name</span><span class="p">)</span> <span class="ow">and</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">isdir</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_df_name</span><span class="p">):</span>
-</span><span id="L-56"><a href="#L-56"><span class="linenos">56</span></a>            <span class="n">shutil</span><span class="o">.</span><span class="n">rmtree</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_df_name</span><span class="p">)</span>
-</span><span id="L-57"><a href="#L-57"><span class="linenos">57</span></a>        <span class="n">os</span><span class="o">.</span><span class="n">mkdir</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_df_name</span><span class="p">)</span>
-</span><span id="L-58"><a href="#L-58"><span class="linenos">58</span></a>        <span class="n">dfx</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;./</span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_df_name</span><span class="si">}</span><span class="s1">/data.csv&#39;</span><span class="p">,</span> <span class="n">index</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-</span><span id="L-59"><a href="#L-59"><span class="linenos">59</span></a>
-</span><span id="L-60"><a href="#L-60"><span class="linenos">60</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Generated dataset </span><span class="si">{</span><span class="n">dfx</span><span class="o">.</span><span class="n">shape</span><span class="si">}</span><span class="s1"> in </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_df_name</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="L-61"><a href="#L-61"><span class="linenos">61</span></a>    <span class="k">elif</span> <span class="n">args</span><span class="o">.</span><span class="n">verify_outputs</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-62"><a href="#L-62"><span class="linenos">62</span></a>        <span class="n">rankings</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">read_csv</span><span class="p">(</span>
-</span><span id="L-63"><a href="#L-63"><span class="linenos">63</span></a>            <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">verify_outputs</span><span class="p">,</span> <span class="s1">&#39;feature_singles.tsv&#39;</span><span class="p">),</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="L-64"><a href="#L-64"><span class="linenos">64</span></a>        <span class="p">)</span>
-</span><span id="L-65"><a href="#L-65"><span class="linenos">65</span></a>        <span class="k">if</span> <span class="n">rankings</span><span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">1</span><span class="p">][</span><span class="s1">&#39;Feature&#39;</span><span class="p">]</span> <span class="o">!=</span> <span class="s1">&#39;f30-(81; 100)&#39;</span><span class="p">:</span>
-</span><span id="L-66"><a href="#L-66"><span class="linenos">66</span></a>            <span class="k">raise</span> <span class="ne">Exception</span><span class="p">(</span>
-</span><span id="L-67"><a href="#L-67"><span class="linenos">67</span></a>                <span class="sa">f</span><span class="s1">&#39;Could not retrieve the appropriate feature needle in the haystack </span><span class="si">{</span><span class="n">rankings</span><span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">, exiting&#39;</span><span class="p">,</span>
-</span><span id="L-68"><a href="#L-68"><span class="linenos">68</span></a>            <span class="p">)</span>
-</span><span id="L-69"><a href="#L-69"><span class="linenos">69</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-70"><a href="#L-70"><span class="linenos">70</span></a>            <span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="L-71"><a href="#L-71"><span class="linenos">71</span></a>                <span class="sa">f</span><span class="s1">&#39;Identified the appropriate feature in the haystack (</span><span class="si">{</span><span class="n">rankings</span><span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">)&#39;</span><span class="p">,</span>
-</span><span id="L-72"><a href="#L-72"><span class="linenos">72</span></a>            <span class="p">)</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos">20</span></a>
+</span><span id="L-21"><a href="#L-21"><span class="linenos">21</span></a><span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s1">&#39;__main__&#39;</span><span class="p">:</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos">22</span></a>    <span class="kn">import</span> <span class="nn">argparse</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos">23</span></a>    <span class="kn">import</span> <span class="nn">logging</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a>    <span class="kn">import</span> <span class="nn">os</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a>    <span class="kn">import</span> <span class="nn">shutil</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a>
+</span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a>    <span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos">28</span></a>
+</span><span id="L-29"><a href="#L-29"><span class="linenos">29</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">basicConfig</span><span class="p">(</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos">30</span></a>        <span class="nb">format</span><span class="o">=</span><span class="s1">&#39;</span><span class="si">%(asctime)s</span><span class="s1"> - </span><span class="si">%(message)s</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos">31</span></a>        <span class="n">datefmt</span><span class="o">=</span><span class="s1">&#39;</span><span class="si">%d</span><span class="s1">-%b-%y %H:%M:%S&#39;</span><span class="p">,</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos">32</span></a>    <span class="p">)</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos">33</span></a>    <span class="n">logger</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">getLogger</span><span class="p">(</span><span class="s1">&#39;syn-logger&#39;</span><span class="p">)</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos">34</span></a>    <span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos">35</span></a>
+</span><span id="L-36"><a href="#L-36"><span class="linenos">36</span></a>    <span class="n">parser</span> <span class="o">=</span> <span class="n">argparse</span><span class="o">.</span><span class="n">ArgumentParser</span><span class="p">(</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos">37</span></a>        <span class="n">description</span><span class="o">=</span><span class="s1">&#39;Fast feature screening for sparse data sets.&#39;</span><span class="p">,</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos">38</span></a>        <span class="n">formatter_class</span><span class="o">=</span><span class="n">argparse</span><span class="o">.</span><span class="n">RawTextHelpFormatter</span><span class="p">,</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos">39</span></a>    <span class="p">)</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos">40</span></a>
+</span><span id="L-41"><a href="#L-41"><span class="linenos">41</span></a>    <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--output_df_name&#39;</span><span class="p">,</span> <span class="nb">type</span><span class="o">=</span><span class="nb">str</span><span class="p">,</span> <span class="n">default</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos">42</span></a>
+</span><span id="L-43"><a href="#L-43"><span class="linenos">43</span></a>    <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--verify_outputs&#39;</span><span class="p">,</span> <span class="nb">type</span><span class="o">=</span><span class="nb">str</span><span class="p">,</span> <span class="n">default</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos">44</span></a>
+</span><span id="L-45"><a href="#L-45"><span class="linenos">45</span></a>    <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--num_features&#39;</span><span class="p">,</span> <span class="nb">type</span><span class="o">=</span><span class="nb">int</span><span class="p">,</span> <span class="n">default</span><span class="o">=</span><span class="mi">300</span><span class="p">)</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos">46</span></a>
+</span><span id="L-47"><a href="#L-47"><span class="linenos">47</span></a>    <span class="n">parser</span><span class="o">.</span><span class="n">add_argument</span><span class="p">(</span><span class="s1">&#39;--size&#39;</span><span class="p">,</span> <span class="nb">type</span><span class="o">=</span><span class="nb">int</span><span class="p">,</span> <span class="n">default</span><span class="o">=</span><span class="mi">1000</span><span class="p">)</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos">48</span></a>
+</span><span id="L-49"><a href="#L-49"><span class="linenos">49</span></a>    <span class="n">args</span> <span class="o">=</span> <span class="n">parser</span><span class="o">.</span><span class="n">parse_args</span><span class="p">()</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos">50</span></a>
+</span><span id="L-51"><a href="#L-51"><span class="linenos">51</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">output_df_name</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos">52</span></a>        <span class="n">sample</span><span class="p">,</span> <span class="n">target</span> <span class="o">=</span> <span class="n">generate_random_matrix</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">num_features</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">size</span><span class="p">)</span>
+</span><span id="L-53"><a href="#L-53"><span class="linenos">53</span></a>        <span class="n">dfx</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">sample</span><span class="p">)</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos">54</span></a>        <span class="n">dfx</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span><span class="sa">f</span><span class="s1">&#39;f</span><span class="si">{</span><span class="n">x</span><span class="si">}</span><span class="s1">&#39;</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">dfx</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">])]</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos">55</span></a>        <span class="n">dfx</span><span class="p">[</span><span class="s1">&#39;label&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">target</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos">56</span></a>        <span class="k">if</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">exists</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_df_name</span><span class="p">)</span> <span class="ow">and</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">isdir</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_df_name</span><span class="p">):</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos">57</span></a>            <span class="n">shutil</span><span class="o">.</span><span class="n">rmtree</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_df_name</span><span class="p">)</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos">58</span></a>        <span class="n">os</span><span class="o">.</span><span class="n">mkdir</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_df_name</span><span class="p">)</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos">59</span></a>        <span class="n">dfx</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;./</span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_df_name</span><span class="si">}</span><span class="s1">/data.csv&#39;</span><span class="p">,</span> <span class="n">index</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos">60</span></a>
+</span><span id="L-61"><a href="#L-61"><span class="linenos">61</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Generated dataset </span><span class="si">{</span><span class="n">dfx</span><span class="o">.</span><span class="n">shape</span><span class="si">}</span><span class="s1"> in </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_df_name</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos">62</span></a>    <span class="k">elif</span> <span class="n">args</span><span class="o">.</span><span class="n">verify_outputs</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos">63</span></a>        <span class="n">rankings</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">read_csv</span><span class="p">(</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos">64</span></a>            <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">verify_outputs</span><span class="p">,</span> <span class="s1">&#39;feature_singles.tsv&#39;</span><span class="p">),</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos">65</span></a>        <span class="p">)</span>
+</span><span id="L-66"><a href="#L-66"><span class="linenos">66</span></a>        <span class="k">if</span> <span class="n">rankings</span><span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">1</span><span class="p">][</span><span class="s1">&#39;Feature&#39;</span><span class="p">]</span> <span class="o">!=</span> <span class="s1">&#39;f30-(81; 100)&#39;</span><span class="p">:</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos">67</span></a>            <span class="k">raise</span> <span class="ne">Exception</span><span class="p">(</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos">68</span></a>                <span class="sa">f</span><span class="s1">&#39;Could not retrieve the appropriate feature needle in the haystack </span><span class="si">{</span><span class="n">rankings</span><span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">, exiting&#39;</span><span class="p">,</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos">69</span></a>            <span class="p">)</span>
+</span><span id="L-70"><a href="#L-70"><span class="linenos">70</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-71"><a href="#L-71"><span class="linenos">71</span></a>            <span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="L-72"><a href="#L-72"><span class="linenos">72</span></a>                <span class="sa">f</span><span class="s1">&#39;Identified the appropriate feature in the haystack (</span><span class="si">{</span><span class="n">rankings</span><span class="o">.</span><span class="n">iloc</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">)&#39;</span><span class="p">,</span>
+</span><span id="L-73"><a href="#L-73"><span class="linenos">73</span></a>            <span class="p">)</span>
 </span></pre></div>
 
 
@@ -133,7 +134,7 @@ <h1 class="modulename">
                 <section id="generate_random_matrix">
                             <input id="generate_random_matrix-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">generate_random_matrix</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">num_features</span><span class="o">=</span><span class="mi">100</span>, </span><span class="param"><span class="n">size</span><span class="o">=</span><span class="mi">20000</span></span><span class="return-annotation">):</span></span>
 
@@ -148,12 +149,13 @@ <h1 class="modulename">
 </span><span id="generate_random_matrix-14"><a href="#generate_random_matrix-14"><span class="linenos">14</span></a>    <span class="n">target</span> <span class="o">=</span> <span class="n">sample</span><span class="p">[:,</span> <span class="mi">30</span><span class="p">]</span>
 </span><span id="generate_random_matrix-15"><a href="#generate_random_matrix-15"><span class="linenos">15</span></a>    <span class="c1"># Some noise</span>
 </span><span id="generate_random_matrix-16"><a href="#generate_random_matrix-16"><span class="linenos">16</span></a>
-</span><span id="generate_random_matrix-17"><a href="#generate_random_matrix-17"><span class="linenos">17</span></a>    <span class="n">target</span><span class="p">[</span><span class="n">target</span> <span class="o">&lt;</span> <span class="mi">20</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="generate_random_matrix-18"><a href="#generate_random_matrix-18"><span class="linenos">18</span></a>    <span class="k">return</span> <span class="n">sample</span><span class="p">,</span> <span class="n">target</span>
+</span><span id="generate_random_matrix-17"><a href="#generate_random_matrix-17"><span class="linenos">17</span></a>    <span class="n">target</span><span class="p">[</span><span class="n">target</span> <span class="o">&lt;</span> <span class="mi">40</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="generate_random_matrix-18"><a href="#generate_random_matrix-18"><span class="linenos">18</span></a>    <span class="n">target</span><span class="p">[</span><span class="n">target</span> <span class="o">&gt;</span> <span class="mi">39</span><span class="p">]</span> <span class="o">=</span> <span class="mi">1</span>
+</span><span id="generate_random_matrix-19"><a href="#generate_random_matrix-19"><span class="linenos">19</span></a>    <span class="k">return</span> <span class="n">sample</span><span class="p">,</span> <span class="n">target</span>
 </span></pre></div>
 
 
-
+    
 
                 </section>
     </main>
@@ -339,4 +341,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/core_ranking.html b/docs/outrank/core_ranking.html
index 2c41396..9f3ea65 100644
--- a/docs/outrank/core_ranking.html
+++ b/docs/outrank/core_ranking.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.core_ranking API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -96,9 +96,6 @@ <h2>API Documentation</h2>
             <li>
                     <a class="function" href="#compute_batch_ranking">compute_batch_ranking</a>
             </li>
-            <li>
-                    <a class="function" href="#get_num_of_instances">get_num_of_instances</a>
-            </li>
             <li>
                     <a class="function" href="#get_grouped_df">get_grouped_df</a>
             </li>
@@ -124,7 +121,7 @@ <h2>API Documentation</h2>
                     <h1 class="modulename">
 <a href="./../outrank.html">outrank</a><wbr>.core_ranking    </h1>
 
-
+                
                         <input id="mod-core_ranking-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 
                         <label class="view-source-button" for="mod-core_ranking-view-source"><span>View Source</span></label>
@@ -152,738 +149,740 @@ <h1 class="modulename">
 </span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a><span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
 </span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a><span class="kn">import</span> <span class="nn">tqdm</span>
 </span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a>
-</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a><span class="kn">from</span> <span class="nn">outrank.algorithms.importance_estimator</span> <span class="kn">import</span> <span class="n">get_importances_estimate_pairwise</span>
-</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a><span class="kn">from</span> <span class="nn">outrank.algorithms.sketches.counting_counters_ordinary</span> <span class="kn">import</span> <span class="n">PrimitiveConstrainedCounter</span>
-</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a><span class="kn">from</span> <span class="nn">outrank.algorithms.sketches.counting_ultiloglog</span> <span class="kn">import</span> <span class="p">(</span>
-</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a>    <span class="n">HyperLogLogWCache</span> <span class="k">as</span> <span class="n">HyperLogLog</span><span class="p">,</span>
-</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a><span class="p">)</span>
-</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">BatchRankingSummary</span>
-</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">extract_features_from_reference_JSON</span>
-</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">generic_line_parser</span>
-</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">internal_hash</span>
-</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">NominalFeatureSummary</span>
-</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">NumericFeatureSummary</span>
-</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a><span class="kn">from</span> <span class="nn">outrank.feature_transformations.ranking_transformers</span> <span class="kn">import</span> <span class="n">FeatureTransformerGeneric</span>
-</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a><span class="kn">from</span> <span class="nn">outrank.feature_transformations.ranking_transformers</span> <span class="kn">import</span> <span class="n">FeatureTransformerNoise</span>
-</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a>
-</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a><span class="n">logger</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">getLogger</span><span class="p">(</span><span class="s1">&#39;syn-logger&#39;</span><span class="p">)</span>
-</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
-</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a><span class="n">random</span><span class="o">.</span><span class="n">seed</span><span class="p">(</span><span class="n">a</span><span class="o">=</span><span class="mi">123</span><span class="p">,</span> <span class="n">version</span><span class="o">=</span><span class="mi">2</span><span class="p">)</span>
-</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a><span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
-</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a><span class="n">GLOBAL_COUNTS_STORAGE</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
-</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a><span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="n">Counter</span><span class="p">()</span>
-</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a><span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="n">Counter</span><span class="p">()</span>
-</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a><span class="n">IGNORED_VALUES</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span>
-</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a><span class="n">HYPERLL_ERROR_BOUND</span> <span class="o">=</span> <span class="mf">0.02</span>
-</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a><span class="n">MAX_FEATURES_3MR</span> <span class="o">=</span> <span class="mi">10</span> <span class="o">**</span> <span class="mi">4</span>
-</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a>
-</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a>
-</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a><span class="k">def</span> <span class="nf">prior_combinations_sample</span><span class="p">(</span><span class="n">combinations</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="o">...</span><span class="p">]],</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="o">...</span><span class="p">]]:</span>
-</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Make sure only relevant subspace of combinations is selected based on prior counts&quot;&quot;&quot;</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a><span class="kn">from</span> <span class="nn">outrank.algorithms.importance_estimator</span> <span class="kn">import</span> \
+</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a>    <span class="n">get_importances_estimate_pairwise</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a><span class="kn">from</span> <span class="nn">outrank.algorithms.sketches.counting_counters_ordinary</span> <span class="kn">import</span> \
+</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a>    <span class="n">PrimitiveConstrainedCounter</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a><span class="kn">from</span> <span class="nn">outrank.algorithms.sketches.counting_ultiloglog</span> <span class="kn">import</span> \
+</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a>    <span class="n">HyperLogLogWCache</span> <span class="k">as</span> <span class="n">HyperLogLog</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">BatchRankingSummary</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">extract_features_from_reference_JSON</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">generic_line_parser</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">get_num_of_instances</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">internal_hash</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">is_prior_heuristic</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">NominalFeatureSummary</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">NumericFeatureSummary</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a><span class="kn">from</span> <span class="nn">outrank.feature_transformations.ranking_transformers</span> <span class="kn">import</span> <span class="n">FeatureTransformerGeneric</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a><span class="kn">from</span> <span class="nn">outrank.feature_transformations.ranking_transformers</span> <span class="kn">import</span> <span class="n">FeatureTransformerNoise</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a>
+</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a><span class="n">logger</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">getLogger</span><span class="p">(</span><span class="s1">&#39;syn-logger&#39;</span><span class="p">)</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a><span class="n">random</span><span class="o">.</span><span class="n">seed</span><span class="p">(</span><span class="n">a</span><span class="o">=</span><span class="mi">123</span><span class="p">,</span> <span class="n">version</span><span class="o">=</span><span class="mi">2</span><span class="p">)</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a><span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a><span class="n">GLOBAL_COUNTS_STORAGE</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a><span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="n">Counter</span><span class="p">()</span>
+</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a><span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="n">Counter</span><span class="p">()</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a><span class="n">IGNORED_VALUES</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span>
+</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a><span class="n">HYPERLL_ERROR_BOUND</span> <span class="o">=</span> <span class="mf">0.02</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a><span class="n">MAX_FEATURES_3MR</span> <span class="o">=</span> <span class="mi">10</span> <span class="o">**</span> <span class="mi">4</span>
+</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a>
 </span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a>
-</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a>        <span class="k">for</span> <span class="n">combination</span> <span class="ow">in</span> <span class="n">combinations</span><span class="p">:</span>
-</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a>            <span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="p">[</span><span class="n">combination</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a>        <span class="n">tmp</span> <span class="o">=</span> <span class="n">combinations</span><span class="p">[:</span><span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span><span class="p">]</span>
-</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a>        <span class="n">tmp</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">sorted</span><span class="p">(</span><span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="o">.</span><span class="n">items</span><span class="p">(),</span> <span class="n">key</span><span class="o">=</span><span class="k">lambda</span> <span class="n">x</span><span class="p">:</span><span class="n">x</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">reverse</span><span class="o">=</span><span class="kc">False</span><span class="p">))[:</span><span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span><span class="p">]</span>
-</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a>
-</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>    <span class="k">for</span> <span class="n">combination</span> <span class="ow">in</span> <span class="n">tmp</span><span class="p">:</span>
-</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a>        <span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="p">[</span><span class="n">combination</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a>
-</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a>    <span class="k">return</span> <span class="n">tmp</span>
-</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a>
+</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a><span class="k">def</span> <span class="nf">prior_combinations_sample</span><span class="p">(</span><span class="n">combinations</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="o">...</span><span class="p">]],</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="o">...</span><span class="p">]]:</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Make sure only relevant subspace of combinations is selected based on prior counts&quot;&quot;&quot;</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a>
+</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">combinations</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a>        <span class="k">return</span> <span class="p">[]</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a>
+</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a>    <span class="n">missing_combinations</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">combinations</span><span class="p">))</span><span class="o">.</span><span class="n">difference</span><span class="p">(</span><span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">missing_combinations</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a>        <span class="k">for</span> <span class="n">combination</span> <span class="ow">in</span> <span class="n">missing_combinations</span><span class="p">:</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a>            <span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="p">[</span><span class="n">combination</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a>
+</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a>    <span class="n">tmp</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span><span class="n">combinations</span><span class="p">,</span> <span class="n">key</span><span class="o">=</span><span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="o">.</span><span class="n">get</span><span class="p">,</span> <span class="n">reverse</span><span class="o">=</span><span class="kc">False</span><span class="p">)[:</span><span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span><span class="p">]</span>
 </span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>
-</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a><span class="k">def</span> <span class="nf">get_combinations_from_columns</span><span class="p">(</span><span class="n">all_columns</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Index</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="o">...</span><span class="p">]]:</span>
-</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Return feature-feature &amp; feature-label combinations, depending on the heuristic and ranking scope&quot;&quot;&quot;</span>
+</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a>    <span class="k">for</span> <span class="n">combination</span> <span class="ow">in</span> <span class="n">tmp</span><span class="p">:</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a>        <span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="p">[</span><span class="n">combination</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
 </span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a>
-</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a>    <span class="k">if</span> <span class="s1">&#39;3mr&#39;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">:</span>
-</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>        <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span> <span class="o">&gt;</span> <span class="n">MAX_FEATURES_3MR</span><span class="p">:</span>
-</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>            <span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span> <span class="o">=</span> <span class="n">MAX_FEATURES_3MR</span>
-</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a>        <span class="n">rel_columns</span> <span class="o">=</span> <span class="p">[</span><span class="n">column</span> <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">all_columns</span> <span class="k">if</span> <span class="s1">&#39; AND_REL &#39;</span> <span class="ow">in</span> <span class="n">column</span><span class="p">]</span>
-</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a>        <span class="n">non_rel_columns</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">all_columns</span><span class="p">)</span> <span class="o">-</span> <span class="nb">set</span><span class="p">(</span><span class="n">rel_columns</span><span class="p">))</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a>    <span class="k">return</span> <span class="n">tmp</span>
+</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>
+</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>
+</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a><span class="k">def</span> <span class="nf">get_combinations_from_columns</span><span class="p">(</span><span class="n">all_columns</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Index</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="o">...</span><span class="p">]]:</span>
+</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Return feature-feature &amp; feature-label combinations, depending on the heuristic and ranking scope&quot;&quot;&quot;</span>
 </span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a>
-</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a>        <span class="n">combinations</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span>
-</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a>            <span class="n">itertools</span><span class="o">.</span><span class="n">combinations_with_replacement</span><span class="p">(</span><span class="n">non_rel_columns</span><span class="p">,</span> <span class="mi">2</span><span class="p">),</span>
-</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a>        <span class="p">)</span>
-</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a>        <span class="n">combinations</span> <span class="o">+=</span> <span class="p">[(</span><span class="n">column</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span><span class="p">)</span> <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">rel_columns</span><span class="p">]</span>
-</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a>        <span class="n">_combinations</span> <span class="o">=</span> <span class="n">itertools</span><span class="o">.</span><span class="n">combinations_with_replacement</span><span class="p">(</span><span class="n">all_columns</span><span class="p">,</span> <span class="mi">2</span><span class="p">)</span>
-</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a>
-</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a>        <span class="c1"># Some applications do not require the full feature-feature triangular matrix</span>
-</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a>        <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">target_ranking_only</span> <span class="o">==</span> <span class="s1">&#39;True&#39;</span><span class="p">:</span>
-</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a>            <span class="n">combinations</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">_combinations</span> <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span> <span class="ow">in</span> <span class="n">x</span><span class="p">]</span>
-</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>            <span class="n">combinations</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">_combinations</span><span class="p">)</span>
+</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a>    <span class="k">if</span> <span class="s1">&#39;3mr&#39;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">:</span>
+</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a>        <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span> <span class="o">&gt;</span> <span class="n">MAX_FEATURES_3MR</span><span class="p">:</span>
+</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a>            <span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span> <span class="o">=</span> <span class="n">MAX_FEATURES_3MR</span>
+</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a>        <span class="n">rel_columns</span> <span class="o">=</span> <span class="p">[</span><span class="n">column</span> <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">all_columns</span> <span class="k">if</span> <span class="s1">&#39; AND_REL &#39;</span> <span class="ow">in</span> <span class="n">column</span><span class="p">]</span>
+</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a>        <span class="n">non_rel_columns</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">all_columns</span><span class="p">)</span> <span class="o">-</span> <span class="nb">set</span><span class="p">(</span><span class="n">rel_columns</span><span class="p">))</span>
+</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a>
+</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a>        <span class="n">combinations</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span>
+</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a>            <span class="n">itertools</span><span class="o">.</span><span class="n">combinations_with_replacement</span><span class="p">(</span><span class="n">non_rel_columns</span><span class="p">,</span> <span class="mi">2</span><span class="p">),</span>
+</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a>        <span class="p">)</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a>        <span class="n">combinations</span> <span class="o">+=</span> <span class="p">[(</span><span class="n">column</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span><span class="p">)</span> <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">rel_columns</span><span class="p">]</span>
+</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>        <span class="n">_combinations</span> <span class="o">=</span> <span class="n">itertools</span><span class="o">.</span><span class="n">combinations_with_replacement</span><span class="p">(</span><span class="n">all_columns</span><span class="p">,</span> <span class="mi">2</span><span class="p">)</span>
 </span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a>
-</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">target_ranking_only</span> <span class="o">!=</span> <span class="s1">&#39;True&#39;</span><span class="p">:</span>
-</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a>        <span class="c1"># Diagonal elements (non-label)</span>
-</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a>        <span class="n">combinations</span> <span class="o">+=</span> <span class="p">[</span>
-</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a>            <span class="p">(</span><span class="n">individual_column</span><span class="p">,</span> <span class="n">individual_column</span><span class="p">)</span>
-</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a>            <span class="k">for</span> <span class="n">individual_column</span> <span class="ow">in</span> <span class="n">all_columns</span>
-</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a>            <span class="k">if</span> <span class="n">individual_column</span> <span class="o">!=</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span>
-</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a>        <span class="p">]</span>
-</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a>    <span class="k">return</span> <span class="n">combinations</span>
-</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a>
-</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a>
-</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a><span class="k">def</span> <span class="nf">mixed_rank_graph</span><span class="p">(</span>
-</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">cpu_pool</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">BatchRankingSummary</span><span class="p">:</span>
-</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute the full mixed rank graph corresponding to all pairwise feature interactions based on the selected heuristic&quot;&quot;&quot;</span>
+</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a>        <span class="c1"># Some applications do not require the full feature-feature triangular matrix</span>
+</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a>        <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">target_ranking_only</span> <span class="o">==</span> <span class="s1">&#39;True&#39;</span><span class="p">:</span>
+</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a>            <span class="n">combinations</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">_combinations</span> <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span> <span class="ow">in</span> <span class="n">x</span><span class="p">]</span>
+</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a>            <span class="n">combinations</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">_combinations</span><span class="p">)</span>
+</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a>
+</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">target_ranking_only</span> <span class="o">!=</span> <span class="s1">&#39;True&#39;</span><span class="p">:</span>
+</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a>        <span class="c1"># Diagonal elements (non-label)</span>
+</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a>        <span class="n">combinations</span> <span class="o">+=</span> <span class="p">[</span>
+</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a>            <span class="p">(</span><span class="n">individual_column</span><span class="p">,</span> <span class="n">individual_column</span><span class="p">)</span>
+</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a>            <span class="k">for</span> <span class="n">individual_column</span> <span class="ow">in</span> <span class="n">all_columns</span>
+</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>            <span class="k">if</span> <span class="n">individual_column</span> <span class="o">!=</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span>
+</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a>        <span class="p">]</span>
+</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a>    <span class="k">return</span> <span class="n">combinations</span>
 </span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a>
-</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a>    <span class="n">all_columns</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span>
-</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a>
-</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>    <span class="n">triplets</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="s1">&#39;category&#39;</span><span class="p">)</span>
-</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a>    <span class="n">out_time_struct</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a>
+</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a><span class="k">def</span> <span class="nf">mixed_rank_graph</span><span class="p">(</span>
+</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">cpu_pool</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">BatchRankingSummary</span><span class="p">:</span>
+</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute the full mixed rank graph corresponding to all pairwise feature interactions based on the selected heuristic&quot;&quot;&quot;</span>
 </span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a>
-</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a>    <span class="c1"># Handle cont. types prior to interaction evaluation</span>
-</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Encoding columns&#39;</span><span class="p">)</span>
-</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a>    <span class="n">start_enc_timer</span> <span class="o">=</span> <span class="n">timer</span><span class="p">()</span>
-</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">({</span><span class="n">k</span> <span class="p">:</span> <span class="n">tmp_df</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">cat</span><span class="o">.</span><span class="n">codes</span> <span class="k">for</span> <span class="n">k</span> <span class="ow">in</span> <span class="n">all_columns</span><span class="p">})</span>
-</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a>
-</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a>    <span class="n">end_enc_timer</span> <span class="o">=</span> <span class="n">timer</span><span class="p">()</span>
-</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a>    <span class="n">out_time_struct</span><span class="p">[</span><span class="s1">&#39;encoding_columns&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">end_enc_timer</span> <span class="o">-</span> <span class="n">start_enc_timer</span>
-</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a>
-</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a>    <span class="n">combinations</span> <span class="o">=</span> <span class="n">get_combinations_from_columns</span><span class="p">(</span><span class="n">all_columns</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a>    <span class="n">combinations</span> <span class="o">=</span> <span class="n">prior_combinations_sample</span><span class="p">(</span><span class="n">combinations</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a>    <span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">combinations</span><span class="p">)</span>
-</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a>
-</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">==</span> <span class="s1">&#39;Constant&#39;</span><span class="p">:</span>
-</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a>        <span class="n">final_constant_imp</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a>        <span class="k">for</span> <span class="n">c1</span><span class="p">,</span> <span class="n">c2</span> <span class="ow">in</span> <span class="n">combinations</span><span class="p">:</span>
-</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>            <span class="n">final_constant_imp</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">c1</span><span class="p">,</span> <span class="n">c2</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">))</span>
-</span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>
-</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a>        <span class="n">out_time_struct</span><span class="p">[</span><span class="s1">&#39;feature_score_computation&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">end_enc_timer</span> <span class="o">-</span> \
-</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a>            <span class="n">start_enc_timer</span>
-</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a>        <span class="k">return</span> <span class="n">BatchRankingSummary</span><span class="p">(</span><span class="n">final_constant_imp</span><span class="p">,</span> <span class="n">out_time_struct</span><span class="p">)</span>
+</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a>    <span class="n">all_columns</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span>
+</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a>
+</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a>    <span class="n">triplets</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="s1">&#39;category&#39;</span><span class="p">)</span>
+</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a>    <span class="n">out_time_struct</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a>
+</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a>    <span class="c1"># Handle cont. types prior to interaction evaluation</span>
+</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Encoding columns&#39;</span><span class="p">)</span>
+</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a>    <span class="n">start_enc_timer</span> <span class="o">=</span> <span class="n">timer</span><span class="p">()</span>
+</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">({</span><span class="n">k</span> <span class="p">:</span> <span class="n">tmp_df</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">cat</span><span class="o">.</span><span class="n">codes</span> <span class="k">for</span> <span class="n">k</span> <span class="ow">in</span> <span class="n">all_columns</span><span class="p">})</span>
+</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a>
+</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a>    <span class="n">end_enc_timer</span> <span class="o">=</span> <span class="n">timer</span><span class="p">()</span>
+</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a>    <span class="n">out_time_struct</span><span class="p">[</span><span class="s1">&#39;encoding_columns&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">end_enc_timer</span> <span class="o">-</span> <span class="n">start_enc_timer</span>
+</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a>
+</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a>    <span class="n">combinations</span> <span class="o">=</span> <span class="n">get_combinations_from_columns</span><span class="p">(</span><span class="n">all_columns</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>
+</span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>    <span class="n">reference_model_features</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a>    <span class="k">if</span> <span class="n">is_prior_heuristic</span><span class="p">(</span><span class="n">args</span><span class="p">):</span>
+</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a>        <span class="n">reference_model_features</span> <span class="o">=</span> <span class="p">[(</span><span class="s1">&#39; AND &#39;</span><span class="p">)</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="nb">tuple</span><span class="p">(</span><span class="nb">sorted</span><span class="p">(</span><span class="n">item</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))))</span> <span class="k">for</span> <span class="n">item</span> <span class="ow">in</span> <span class="n">extract_features_from_reference_JSON</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span><span class="p">,</span> <span class="n">all_features</span><span class="o">=</span><span class="kc">True</span><span class="p">)]</span>
+</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a>        <span class="n">combinations</span> <span class="o">=</span> <span class="p">[</span><span class="n">comb</span> <span class="k">for</span> <span class="n">comb</span> <span class="ow">in</span> <span class="n">combinations</span> <span class="k">if</span> <span class="n">comb</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">reference_model_features</span> <span class="ow">and</span> <span class="n">comb</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">reference_model_features</span><span class="p">]</span>
 </span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a>
-</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a>    <span class="c1"># Map the scoring calls to the worker pool</span>
-</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Allocating thread pool&#39;</span><span class="p">)</span>
+</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a>    <span class="n">combinations</span> <span class="o">=</span> <span class="n">prior_combinations_sample</span><span class="p">(</span><span class="n">combinations</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a>    <span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">combinations</span><span class="p">)</span>
 </span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a>
-</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a>    <span class="c1"># starmap is an alternative that is slower unfortunately (but nicer)</span>
-</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a>    <span class="k">def</span> <span class="nf">get_grounded_importances_estimate</span><span class="p">(</span><span class="n">combination</span><span class="p">:</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
-</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a>        <span class="k">return</span> <span class="n">get_importances_estimate_pairwise</span><span class="p">(</span><span class="n">combination</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">tmp_df</span><span class="o">=</span><span class="n">tmp_df</span><span class="p">)</span>
-</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a>
-</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a>    <span class="n">start_enc_timer</span> <span class="o">=</span> <span class="n">timer</span><span class="p">()</span>
-</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a>    <span class="k">with</span> <span class="n">cpu_pool</span> <span class="k">as</span> <span class="n">p</span><span class="p">:</span>
-</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Computing (#ftr=</span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">combinations</span><span class="p">)</span><span class="si">}</span><span class="s1">)&#39;</span><span class="p">)</span>
-</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a>        <span class="n">results</span> <span class="o">=</span> <span class="n">p</span><span class="o">.</span><span class="n">amap</span><span class="p">(</span><span class="n">get_grounded_importances_estimate</span><span class="p">,</span> <span class="n">combinations</span><span class="p">)</span>
-</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a>        <span class="k">while</span> <span class="ow">not</span> <span class="n">results</span><span class="o">.</span><span class="n">ready</span><span class="p">():</span>
-</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a>            <span class="n">time</span><span class="o">.</span><span class="n">sleep</span><span class="p">(</span><span class="mi">4</span><span class="p">)</span>
-</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a>        <span class="n">triplets</span> <span class="o">=</span> <span class="n">results</span><span class="o">.</span><span class="n">get</span><span class="p">()</span>
-</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a>    <span class="n">end_enc_timer</span> <span class="o">=</span> <span class="n">timer</span><span class="p">()</span>
-</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a>    <span class="n">out_time_struct</span><span class="p">[</span><span class="s1">&#39;feature_score_computation&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">end_enc_timer</span> <span class="o">-</span> \
-</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a>        <span class="n">start_enc_timer</span>
-</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a>
-</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a>    <span class="c1"># Gather the final triplets</span>
-</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Aggregation of ranking results&#39;</span><span class="p">)</span>
-</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a>    <span class="n">final_triplets</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a>    <span class="k">for</span> <span class="n">triplet</span> <span class="ow">in</span> <span class="n">triplets</span><span class="p">:</span>
-</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a>        <span class="n">inv</span> <span class="o">=</span> <span class="p">(</span><span class="n">triplet</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">triplet</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">triplet</span><span class="p">[</span><span class="mi">2</span><span class="p">])</span>
-</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a>        <span class="n">final_triplets</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">inv</span><span class="p">)</span>
-</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a>        <span class="n">final_triplets</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">triplet</span><span class="p">)</span>
-</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a>        <span class="n">triplets</span> <span class="o">=</span> <span class="n">final_triplets</span>
-</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a>
-</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Proceeding to the next batch of data&#39;</span><span class="p">)</span>
-</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a>    <span class="k">return</span> <span class="n">BatchRankingSummary</span><span class="p">(</span><span class="n">triplets</span><span class="p">,</span> <span class="n">out_time_struct</span><span class="p">)</span>
+</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">==</span> <span class="s1">&#39;Constant&#39;</span><span class="p">:</span>
+</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a>        <span class="n">final_constant_imp</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a>        <span class="k">for</span> <span class="n">c1</span><span class="p">,</span> <span class="n">c2</span> <span class="ow">in</span> <span class="n">combinations</span><span class="p">:</span>
+</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a>            <span class="n">final_constant_imp</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">c1</span><span class="p">,</span> <span class="n">c2</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">))</span>
+</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a>
+</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a>        <span class="n">out_time_struct</span><span class="p">[</span><span class="s1">&#39;feature_score_computation&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">end_enc_timer</span> <span class="o">-</span> \
+</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a>            <span class="n">start_enc_timer</span>
+</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a>        <span class="k">return</span> <span class="n">BatchRankingSummary</span><span class="p">(</span><span class="n">final_constant_imp</span><span class="p">,</span> <span class="n">out_time_struct</span><span class="p">)</span>
+</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a>
+</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a>    <span class="c1"># Map the scoring calls to the worker pool</span>
+</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Allocating thread pool&#39;</span><span class="p">)</span>
+</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a>
+</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a>    <span class="c1"># starmap is an alternative that is slower unfortunately (but nicer)</span>
+</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a>    <span class="k">def</span> <span class="nf">get_grounded_importances_estimate</span><span class="p">(</span><span class="n">combination</span><span class="p">:</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
+</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a>        <span class="k">return</span> <span class="n">get_importances_estimate_pairwise</span><span class="p">(</span><span class="n">combination</span><span class="p">,</span> <span class="n">reference_model_features</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">tmp_df</span><span class="o">=</span><span class="n">tmp_df</span><span class="p">)</span>
+</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a>
+</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a>    <span class="n">start_enc_timer</span> <span class="o">=</span> <span class="n">timer</span><span class="p">()</span>
+</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a>    <span class="k">with</span> <span class="n">cpu_pool</span> <span class="k">as</span> <span class="n">p</span><span class="p">:</span>
+</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Computing (#ftr=</span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">combinations</span><span class="p">)</span><span class="si">}</span><span class="s1">)&#39;</span><span class="p">)</span>
+</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a>        <span class="n">results</span> <span class="o">=</span> <span class="n">p</span><span class="o">.</span><span class="n">amap</span><span class="p">(</span><span class="n">get_grounded_importances_estimate</span><span class="p">,</span> <span class="n">combinations</span><span class="p">)</span>
+</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a>        <span class="k">while</span> <span class="ow">not</span> <span class="n">results</span><span class="o">.</span><span class="n">ready</span><span class="p">():</span>
+</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a>            <span class="n">time</span><span class="o">.</span><span class="n">sleep</span><span class="p">(</span><span class="mi">4</span><span class="p">)</span>
+</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a>        <span class="n">triplets</span> <span class="o">=</span> <span class="n">results</span><span class="o">.</span><span class="n">get</span><span class="p">()</span>
+</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a>    <span class="n">end_enc_timer</span> <span class="o">=</span> <span class="n">timer</span><span class="p">()</span>
+</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a>    <span class="n">out_time_struct</span><span class="p">[</span><span class="s1">&#39;feature_score_computation&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">end_enc_timer</span> <span class="o">-</span> \
+</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a>        <span class="n">start_enc_timer</span>
 </span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a>
-</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a>
-</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a><span class="k">def</span> <span class="nf">enrich_with_transformations</span><span class="p">(</span>
-</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">num_col_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Construct a collection of new features based on pre-defined transformations/rules&quot;&quot;&quot;</span>
-</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a>
-</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a>    <span class="n">transformer</span> <span class="o">=</span> <span class="n">FeatureTransformerGeneric</span><span class="p">(</span>
-</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>        <span class="n">num_col_types</span><span class="p">,</span> <span class="n">preset</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">transformers</span><span class="p">,</span>
-</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a>    <span class="p">)</span>
-</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a>    <span class="n">transformed_df</span> <span class="o">=</span> <span class="n">transformer</span><span class="o">.</span><span class="n">construct_new_features</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">)</span>
-</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a>    <span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a>        <span class="sa">f</span><span class="s1">&#39;Constructed </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">transformer</span><span class="o">.</span><span class="n">constructed_feature_names</span><span class="p">)</span><span class="si">}</span><span class="s1"> new features ..&#39;</span><span class="p">,</span>
-</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a>    <span class="p">)</span>
-</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a>
-</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a>    <span class="k">return</span> <span class="n">transformed_df</span>
-</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a>
-</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a>
-</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a><span class="k">def</span> <span class="nf">compute_combined_features</span><span class="p">(</span>
-</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span>
-</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a>    <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a>    <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a>    <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a>    <span class="n">is_3mr</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="L-183"><a href="#L-183"><span class="linenos">183</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute higher order features via xxhash-based trick.&quot;&quot;&quot;</span>
+</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a>    <span class="c1"># Gather the final triplets</span>
+</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Aggregation of ranking results&#39;</span><span class="p">)</span>
+</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a>    <span class="n">final_triplets</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a>    <span class="k">for</span> <span class="n">triplet</span> <span class="ow">in</span> <span class="n">triplets</span><span class="p">:</span>
+</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a>        <span class="n">inv</span> <span class="o">=</span> <span class="p">(</span><span class="n">triplet</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">triplet</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">triplet</span><span class="p">[</span><span class="mi">2</span><span class="p">])</span>
+</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a>        <span class="n">final_triplets</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">inv</span><span class="p">)</span>
+</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a>        <span class="n">final_triplets</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">triplet</span><span class="p">)</span>
+</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>        <span class="n">triplets</span> <span class="o">=</span> <span class="n">final_triplets</span>
+</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a>
+</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Proceeding to the next batch of data&#39;</span><span class="p">)</span>
+</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a>    <span class="k">return</span> <span class="n">BatchRankingSummary</span><span class="p">(</span><span class="n">triplets</span><span class="p">,</span> <span class="n">out_time_struct</span><span class="p">)</span>
+</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a>
+</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a>
+</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a><span class="k">def</span> <span class="nf">enrich_with_transformations</span><span class="p">(</span>
+</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">num_col_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Construct a collection of new features based on pre-defined transformations/rules&quot;&quot;&quot;</span>
+</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a>
+</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a>    <span class="n">transformer</span> <span class="o">=</span> <span class="n">FeatureTransformerGeneric</span><span class="p">(</span>
+</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a>        <span class="n">num_col_types</span><span class="p">,</span> <span class="n">preset</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">transformers</span><span class="p">,</span>
+</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a>    <span class="p">)</span>
+</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a>    <span class="n">transformed_df</span> <span class="o">=</span> <span class="n">transformer</span><span class="o">.</span><span class="n">construct_new_features</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">)</span>
+</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a>    <span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="L-183"><a href="#L-183"><span class="linenos">183</span></a>        <span class="sa">f</span><span class="s1">&#39;Constructed </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">transformer</span><span class="o">.</span><span class="n">constructed_feature_names</span><span class="p">)</span><span class="si">}</span><span class="s1"> new features ..&#39;</span><span class="p">,</span>
+</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a>    <span class="p">)</span>
 </span><span id="L-185"><a href="#L-185"><span class="linenos">185</span></a>
-</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a>    <span class="n">all_columns</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a>        <span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span> <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span>
-</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a>    <span class="p">]</span>
-</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a>    <span class="n">join_string</span> <span class="o">=</span> <span class="s1">&#39; AND_REL &#39;</span> <span class="k">if</span> <span class="n">is_3mr</span> <span class="k">else</span> <span class="s1">&#39; AND &#39;</span>
-</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a>    <span class="n">interaction_order</span> <span class="o">=</span> <span class="mi">2</span> <span class="k">if</span> <span class="n">is_3mr</span> <span class="k">else</span> <span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span>
-</span><span id="L-191"><a href="#L-191"><span class="linenos">191</span></a>
-</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span> <span class="o">!=</span> <span class="s1">&#39;&#39;</span><span class="p">:</span>
-</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a>        <span class="n">combined_features</span> <span class="o">=</span> <span class="n">extract_features_from_reference_JSON</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span><span class="p">,</span> <span class="n">combined_features_only</span> <span class="o">=</span> <span class="kc">True</span><span class="p">)</span>
-</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a>        <span class="n">full_combination_space</span> <span class="o">=</span> <span class="p">[</span><span class="n">combination</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">)</span> <span class="k">for</span> <span class="n">combination</span> <span class="ow">in</span> <span class="n">combined_features</span><span class="p">]</span>
-</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a>        <span class="n">full_combination_space</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span>
-</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a>            <span class="n">itertools</span><span class="o">.</span><span class="n">combinations</span><span class="p">(</span><span class="n">all_columns</span><span class="p">,</span> <span class="n">interaction_order</span><span class="p">),</span>
-</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a>        <span class="p">)</span>
-</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a>
-</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span> <span class="o">!=</span> <span class="s1">&#39;&#39;</span><span class="p">:</span>
-</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a>        <span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">full_combination_space</span><span class="p">)</span>
-</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a>        <span class="n">full_combination_space</span> <span class="o">=</span> <span class="n">full_combination_space</span><span class="p">[</span>
-</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a>            <span class="p">:</span> <span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span>
-</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a>        <span class="p">]</span>
+</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a>    <span class="k">return</span> <span class="n">transformed_df</span>
+</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a>
+</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a>
+</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a><span class="k">def</span> <span class="nf">compute_combined_features</span><span class="p">(</span>
+</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span>
+</span><span id="L-191"><a href="#L-191"><span class="linenos">191</span></a>    <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a>    <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a>    <span class="n">is_3mr</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute higher order features via xxhash-based trick.&quot;&quot;&quot;</span>
+</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a>
+</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a>    <span class="n">all_columns</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a>        <span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span> <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span>
+</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a>    <span class="p">]</span>
+</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a>    <span class="n">join_string</span> <span class="o">=</span> <span class="s1">&#39; AND_REL &#39;</span> <span class="k">if</span> <span class="n">is_3mr</span> <span class="k">else</span> <span class="s1">&#39; AND &#39;</span>
+</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a>    <span class="n">interaction_order</span> <span class="o">=</span> <span class="mi">2</span> <span class="k">if</span> <span class="n">is_3mr</span> <span class="k">else</span> <span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span>
+</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a>
+</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a>    <span class="n">model_combinations</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a>    <span class="n">full_combination_space</span> <span class="o">=</span> <span class="p">[]</span>
 </span><span id="L-205"><a href="#L-205"><span class="linenos">205</span></a>
-</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a>    <span class="n">com_counter</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a>    <span class="n">new_feature_hash</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a>    <span class="k">for</span> <span class="n">new_combination</span> <span class="ow">in</span> <span class="n">full_combination_space</span><span class="p">:</span>
-</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span>
-</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a>            <span class="sa">f</span><span class="s1">&#39;Created </span><span class="si">{</span><span class="n">com_counter</span><span class="si">}</span><span class="s1">/</span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">full_combination_space</span><span class="p">)</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a>        <span class="p">)</span>
-</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a>        <span class="n">combined_feature</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="nb">str</span><span class="p">(</span><span class="mi">0</span><span class="p">)]</span> <span class="o">*</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a>        <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">new_combination</span><span class="p">:</span>
-</span><span id="L-214"><a href="#L-214"><span class="linenos">214</span></a>            <span class="n">tmp_feature</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">feature</span><span class="p">]</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a>            <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">el</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">tmp_feature</span><span class="p">):</span>
-</span><span id="L-216"><a href="#L-216"><span class="linenos">216</span></a>                <span class="n">combined_feature</span><span class="p">[</span><span class="n">enx</span><span class="p">]</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span>
-</span><span id="L-217"><a href="#L-217"><span class="linenos">217</span></a>                    <span class="n">internal_hash</span><span class="p">(</span>
-</span><span id="L-218"><a href="#L-218"><span class="linenos">218</span></a>                        <span class="nb">str</span><span class="p">(</span><span class="n">combined_feature</span><span class="p">[</span><span class="n">enx</span><span class="p">])</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="n">el</span><span class="p">),</span>
-</span><span id="L-219"><a href="#L-219"><span class="linenos">219</span></a>                    <span class="p">),</span>
-</span><span id="L-220"><a href="#L-220"><span class="linenos">220</span></a>                <span class="p">)</span>
-</span><span id="L-221"><a href="#L-221"><span class="linenos">221</span></a>        <span class="n">ftr_name</span> <span class="o">=</span> <span class="n">join_string</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">new_combination</span><span class="p">)</span>
-</span><span id="L-222"><a href="#L-222"><span class="linenos">222</span></a>        <span class="n">new_feature_hash</span><span class="p">[</span><span class="n">ftr_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">combined_feature</span>
-</span><span id="L-223"><a href="#L-223"><span class="linenos">223</span></a>        <span class="n">com_counter</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="L-224"><a href="#L-224"><span class="linenos">224</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">new_feature_hash</span><span class="p">)</span>
-</span><span id="L-225"><a href="#L-225"><span class="linenos">225</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Concatenating into final frame ..&#39;</span><span class="p">)</span>
-</span><span id="L-226"><a href="#L-226"><span class="linenos">226</span></a>    <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">([</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="L-227"><a href="#L-227"><span class="linenos">227</span></a>    <span class="k">del</span> <span class="n">tmp_df</span>
-</span><span id="L-228"><a href="#L-228"><span class="linenos">228</span></a>
-</span><span id="L-229"><a href="#L-229"><span class="linenos">229</span></a>    <span class="k">return</span> <span class="n">input_dataframe</span>
-</span><span id="L-230"><a href="#L-230"><span class="linenos">230</span></a>
-</span><span id="L-231"><a href="#L-231"><span class="linenos">231</span></a>
-</span><span id="L-232"><a href="#L-232"><span class="linenos">232</span></a><span class="k">def</span> <span class="nf">compute_expanded_multivalue_features</span><span class="p">(</span>
-</span><span id="L-233"><a href="#L-233"><span class="linenos">233</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="L-234"><a href="#L-234"><span class="linenos">234</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="L-235"><a href="#L-235"><span class="linenos">235</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute one-hot encoded feature space based on each designated multivalue feature. E.g., feature with value &quot;a,b,c&quot; becomes three features, values of which are presence of a given value in a mutlivalue feature of choice.&quot;&quot;&quot;</span>
-</span><span id="L-236"><a href="#L-236"><span class="linenos">236</span></a>
-</span><span id="L-237"><a href="#L-237"><span class="linenos">237</span></a>    <span class="n">considered_multivalue_features</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">explode_multivalue_features</span><span class="o">.</span><span class="n">split</span><span class="p">(</span>
-</span><span id="L-238"><a href="#L-238"><span class="linenos">238</span></a>        <span class="s1">&#39;;&#39;</span><span class="p">,</span>
-</span><span id="L-239"><a href="#L-239"><span class="linenos">239</span></a>    <span class="p">)</span>
-</span><span id="L-240"><a href="#L-240"><span class="linenos">240</span></a>    <span class="n">new_feature_hash</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="L-241"><a href="#L-241"><span class="linenos">241</span></a>    <span class="n">missing_symbols</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">missing_value_symbols</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))</span>
-</span><span id="L-242"><a href="#L-242"><span class="linenos">242</span></a>
-</span><span id="L-243"><a href="#L-243"><span class="linenos">243</span></a>    <span class="k">for</span> <span class="n">multivalue_feature</span> <span class="ow">in</span> <span class="n">considered_multivalue_features</span><span class="p">:</span>
-</span><span id="L-244"><a href="#L-244"><span class="linenos">244</span></a>        <span class="n">multivalue_feature_vector</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">multivalue_feature</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">(</span>
-</span><span id="L-245"><a href="#L-245"><span class="linenos">245</span></a>        <span class="p">)</span>
-</span><span id="L-246"><a href="#L-246"><span class="linenos">246</span></a>        <span class="n">multivalue_feature_vector</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="L-247"><a href="#L-247"><span class="linenos">247</span></a>            <span class="n">x</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">,</span> <span class="s1">&#39;-&#39;</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">multivalue_feature_vector</span>
-</span><span id="L-248"><a href="#L-248"><span class="linenos">248</span></a>        <span class="p">]</span>
-</span><span id="L-249"><a href="#L-249"><span class="linenos">249</span></a>        <span class="n">multivalue_sets</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="L-250"><a href="#L-250"><span class="linenos">250</span></a>            <span class="nb">set</span><span class="p">(</span><span class="n">x</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;-&#39;</span><span class="p">))</span>
-</span><span id="L-251"><a href="#L-251"><span class="linenos">251</span></a>            <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">multivalue_feature_vector</span>
-</span><span id="L-252"><a href="#L-252"><span class="linenos">252</span></a>        <span class="p">]</span>
-</span><span id="L-253"><a href="#L-253"><span class="linenos">253</span></a>        <span class="n">unique_values</span> <span class="o">=</span> <span class="nb">set</span><span class="o">.</span><span class="n">union</span><span class="p">(</span><span class="o">*</span><span class="n">multivalue_sets</span><span class="p">)</span>
-</span><span id="L-254"><a href="#L-254"><span class="linenos">254</span></a>
-</span><span id="L-255"><a href="#L-255"><span class="linenos">255</span></a>        <span class="k">for</span> <span class="n">missing_symbol</span> <span class="ow">in</span> <span class="n">missing_symbols</span><span class="p">:</span>
-</span><span id="L-256"><a href="#L-256"><span class="linenos">256</span></a>            <span class="k">if</span> <span class="n">missing_symbol</span> <span class="ow">in</span> <span class="n">unique_values</span><span class="p">:</span>
-</span><span id="L-257"><a href="#L-257"><span class="linenos">257</span></a>                <span class="n">unique_values</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">missing_symbol</span><span class="p">)</span>
-</span><span id="L-258"><a href="#L-258"><span class="linenos">258</span></a>
-</span><span id="L-259"><a href="#L-259"><span class="linenos">259</span></a>        <span class="k">for</span> <span class="n">unique_value</span> <span class="ow">in</span> <span class="n">unique_values</span><span class="p">:</span>
-</span><span id="L-260"><a href="#L-260"><span class="linenos">260</span></a>            <span class="n">tmp_vec</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-261"><a href="#L-261"><span class="linenos">261</span></a>            <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">multivalue</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">multivalue_sets</span><span class="p">):</span>
-</span><span id="L-262"><a href="#L-262"><span class="linenos">262</span></a>                <span class="k">if</span> <span class="n">unique_value</span> <span class="ow">in</span> <span class="n">multivalue</span><span class="p">:</span>
-</span><span id="L-263"><a href="#L-263"><span class="linenos">263</span></a>                    <span class="n">tmp_vec</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="s1">&#39;1&#39;</span><span class="p">)</span>
-</span><span id="L-264"><a href="#L-264"><span class="linenos">264</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="L-265"><a href="#L-265"><span class="linenos">265</span></a>                    <span class="n">tmp_vec</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
-</span><span id="L-266"><a href="#L-266"><span class="linenos">266</span></a>
-</span><span id="L-267"><a href="#L-267"><span class="linenos">267</span></a>            <span class="n">new_feature_hash</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;MULTIEX-</span><span class="si">{</span><span class="n">multivalue_feature</span><span class="si">}</span><span class="s1">-</span><span class="si">{</span><span class="n">unique_value</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tmp_vec</span>
-</span><span id="L-268"><a href="#L-268"><span class="linenos">268</span></a>
-</span><span id="L-269"><a href="#L-269"><span class="linenos">269</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">new_feature_hash</span><span class="p">)</span>
-</span><span id="L-270"><a href="#L-270"><span class="linenos">270</span></a>    <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">([</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="L-271"><a href="#L-271"><span class="linenos">271</span></a>    <span class="k">del</span> <span class="n">tmp_df</span>
-</span><span id="L-272"><a href="#L-272"><span class="linenos">272</span></a>
-</span><span id="L-273"><a href="#L-273"><span class="linenos">273</span></a>    <span class="k">return</span> <span class="n">input_dataframe</span>
-</span><span id="L-274"><a href="#L-274"><span class="linenos">274</span></a>
+</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a>
+</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a>            <span class="n">full_combination_space</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span>
+</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a>                <span class="n">itertools</span><span class="o">.</span><span class="n">combinations</span><span class="p">(</span><span class="n">all_columns</span><span class="p">,</span> <span class="n">interaction_order</span><span class="p">),</span>
+</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a>            <span class="p">)</span>
+</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a>    <span class="n">full_combination_space</span> <span class="o">=</span> <span class="n">prior_combinations_sample</span><span class="p">(</span><span class="n">full_combination_space</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a>
+</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span> <span class="o">!=</span> <span class="s1">&#39;&#39;</span><span class="p">:</span>
+</span><span id="L-214"><a href="#L-214"><span class="linenos">214</span></a>        <span class="n">model_combinations</span> <span class="o">=</span> <span class="n">extract_features_from_reference_JSON</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span><span class="p">,</span> <span class="n">combined_features_only</span> <span class="o">=</span> <span class="kc">True</span><span class="p">)</span>
+</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a>        <span class="n">model_combinations</span> <span class="o">=</span> <span class="p">[</span><span class="nb">tuple</span><span class="p">(</span><span class="nb">sorted</span><span class="p">(</span><span class="n">combination</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">)))</span> <span class="k">for</span> <span class="n">combination</span> <span class="ow">in</span> <span class="n">model_combinations</span><span class="p">]</span>
+</span><span id="L-216"><a href="#L-216"><span class="linenos">216</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">is_prior_heuristic</span><span class="p">(</span><span class="n">args</span><span class="p">):</span>
+</span><span id="L-217"><a href="#L-217"><span class="linenos">217</span></a>            <span class="n">full_combination_space</span> <span class="o">=</span> <span class="n">model_combinations</span>
+</span><span id="L-218"><a href="#L-218"><span class="linenos">218</span></a>
+</span><span id="L-219"><a href="#L-219"><span class="linenos">219</span></a>    <span class="k">if</span> <span class="n">is_prior_heuristic</span><span class="p">(</span><span class="n">args</span><span class="p">):</span>
+</span><span id="L-220"><a href="#L-220"><span class="linenos">220</span></a>        <span class="n">full_combination_space</span> <span class="o">=</span> <span class="n">full_combination_space</span> <span class="o">+</span> <span class="p">[</span><span class="nb">tuple</span> <span class="k">for</span> <span class="nb">tuple</span> <span class="ow">in</span> <span class="n">model_combinations</span> <span class="k">if</span> <span class="nb">tuple</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">full_combination_space</span><span class="p">]</span>
+</span><span id="L-221"><a href="#L-221"><span class="linenos">221</span></a>
+</span><span id="L-222"><a href="#L-222"><span class="linenos">222</span></a>
+</span><span id="L-223"><a href="#L-223"><span class="linenos">223</span></a>    <span class="n">com_counter</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-224"><a href="#L-224"><span class="linenos">224</span></a>    <span class="n">new_feature_hash</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-225"><a href="#L-225"><span class="linenos">225</span></a>    <span class="k">for</span> <span class="n">new_combination</span> <span class="ow">in</span> <span class="n">full_combination_space</span><span class="p">:</span>
+</span><span id="L-226"><a href="#L-226"><span class="linenos">226</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span>
+</span><span id="L-227"><a href="#L-227"><span class="linenos">227</span></a>            <span class="sa">f</span><span class="s1">&#39;Created </span><span class="si">{</span><span class="n">com_counter</span><span class="si">}</span><span class="s1">/</span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">full_combination_space</span><span class="p">)</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="L-228"><a href="#L-228"><span class="linenos">228</span></a>        <span class="p">)</span>
+</span><span id="L-229"><a href="#L-229"><span class="linenos">229</span></a>        <span class="n">combined_feature</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="nb">str</span><span class="p">(</span><span class="mi">0</span><span class="p">)]</span> <span class="o">*</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="L-230"><a href="#L-230"><span class="linenos">230</span></a>        <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">new_combination</span><span class="p">:</span>
+</span><span id="L-231"><a href="#L-231"><span class="linenos">231</span></a>            <span class="n">tmp_feature</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">feature</span><span class="p">]</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="L-232"><a href="#L-232"><span class="linenos">232</span></a>            <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">el</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">tmp_feature</span><span class="p">):</span>
+</span><span id="L-233"><a href="#L-233"><span class="linenos">233</span></a>                <span class="n">combined_feature</span><span class="p">[</span><span class="n">enx</span><span class="p">]</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span>
+</span><span id="L-234"><a href="#L-234"><span class="linenos">234</span></a>                    <span class="n">internal_hash</span><span class="p">(</span>
+</span><span id="L-235"><a href="#L-235"><span class="linenos">235</span></a>                        <span class="nb">str</span><span class="p">(</span><span class="n">combined_feature</span><span class="p">[</span><span class="n">enx</span><span class="p">])</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="n">el</span><span class="p">),</span>
+</span><span id="L-236"><a href="#L-236"><span class="linenos">236</span></a>                    <span class="p">),</span>
+</span><span id="L-237"><a href="#L-237"><span class="linenos">237</span></a>                <span class="p">)</span>
+</span><span id="L-238"><a href="#L-238"><span class="linenos">238</span></a>        <span class="n">ftr_name</span> <span class="o">=</span> <span class="n">join_string</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">new_combination</span><span class="p">)</span>
+</span><span id="L-239"><a href="#L-239"><span class="linenos">239</span></a>        <span class="n">new_feature_hash</span><span class="p">[</span><span class="n">ftr_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">combined_feature</span>
+</span><span id="L-240"><a href="#L-240"><span class="linenos">240</span></a>        <span class="n">com_counter</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-241"><a href="#L-241"><span class="linenos">241</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">new_feature_hash</span><span class="p">)</span>
+</span><span id="L-242"><a href="#L-242"><span class="linenos">242</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Concatenating into final frame ..&#39;</span><span class="p">)</span>
+</span><span id="L-243"><a href="#L-243"><span class="linenos">243</span></a>    <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">([</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-244"><a href="#L-244"><span class="linenos">244</span></a>    <span class="k">del</span> <span class="n">tmp_df</span>
+</span><span id="L-245"><a href="#L-245"><span class="linenos">245</span></a>
+</span><span id="L-246"><a href="#L-246"><span class="linenos">246</span></a>    <span class="k">return</span> <span class="n">input_dataframe</span>
+</span><span id="L-247"><a href="#L-247"><span class="linenos">247</span></a>
+</span><span id="L-248"><a href="#L-248"><span class="linenos">248</span></a>
+</span><span id="L-249"><a href="#L-249"><span class="linenos">249</span></a><span class="k">def</span> <span class="nf">compute_expanded_multivalue_features</span><span class="p">(</span>
+</span><span id="L-250"><a href="#L-250"><span class="linenos">250</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="L-251"><a href="#L-251"><span class="linenos">251</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="L-252"><a href="#L-252"><span class="linenos">252</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute one-hot encoded feature space based on each designated multivalue feature. E.g., feature with value &quot;a,b,c&quot; becomes three features, values of which are presence of a given value in a mutlivalue feature of choice.&quot;&quot;&quot;</span>
+</span><span id="L-253"><a href="#L-253"><span class="linenos">253</span></a>
+</span><span id="L-254"><a href="#L-254"><span class="linenos">254</span></a>    <span class="n">considered_multivalue_features</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">explode_multivalue_features</span><span class="o">.</span><span class="n">split</span><span class="p">(</span>
+</span><span id="L-255"><a href="#L-255"><span class="linenos">255</span></a>        <span class="s1">&#39;;&#39;</span><span class="p">,</span>
+</span><span id="L-256"><a href="#L-256"><span class="linenos">256</span></a>    <span class="p">)</span>
+</span><span id="L-257"><a href="#L-257"><span class="linenos">257</span></a>    <span class="n">new_feature_hash</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-258"><a href="#L-258"><span class="linenos">258</span></a>    <span class="n">missing_symbols</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">missing_value_symbols</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))</span>
+</span><span id="L-259"><a href="#L-259"><span class="linenos">259</span></a>
+</span><span id="L-260"><a href="#L-260"><span class="linenos">260</span></a>    <span class="k">for</span> <span class="n">multivalue_feature</span> <span class="ow">in</span> <span class="n">considered_multivalue_features</span><span class="p">:</span>
+</span><span id="L-261"><a href="#L-261"><span class="linenos">261</span></a>        <span class="n">multivalue_feature_vector</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">multivalue_feature</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">(</span>
+</span><span id="L-262"><a href="#L-262"><span class="linenos">262</span></a>        <span class="p">)</span>
+</span><span id="L-263"><a href="#L-263"><span class="linenos">263</span></a>        <span class="n">multivalue_feature_vector</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="L-264"><a href="#L-264"><span class="linenos">264</span></a>            <span class="n">x</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">,</span> <span class="s1">&#39;-&#39;</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">multivalue_feature_vector</span>
+</span><span id="L-265"><a href="#L-265"><span class="linenos">265</span></a>        <span class="p">]</span>
+</span><span id="L-266"><a href="#L-266"><span class="linenos">266</span></a>        <span class="n">multivalue_sets</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="L-267"><a href="#L-267"><span class="linenos">267</span></a>            <span class="nb">set</span><span class="p">(</span><span class="n">x</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;-&#39;</span><span class="p">))</span>
+</span><span id="L-268"><a href="#L-268"><span class="linenos">268</span></a>            <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">multivalue_feature_vector</span>
+</span><span id="L-269"><a href="#L-269"><span class="linenos">269</span></a>        <span class="p">]</span>
+</span><span id="L-270"><a href="#L-270"><span class="linenos">270</span></a>        <span class="n">unique_values</span> <span class="o">=</span> <span class="nb">set</span><span class="o">.</span><span class="n">union</span><span class="p">(</span><span class="o">*</span><span class="n">multivalue_sets</span><span class="p">)</span>
+</span><span id="L-271"><a href="#L-271"><span class="linenos">271</span></a>
+</span><span id="L-272"><a href="#L-272"><span class="linenos">272</span></a>        <span class="k">for</span> <span class="n">missing_symbol</span> <span class="ow">in</span> <span class="n">missing_symbols</span><span class="p">:</span>
+</span><span id="L-273"><a href="#L-273"><span class="linenos">273</span></a>            <span class="k">if</span> <span class="n">missing_symbol</span> <span class="ow">in</span> <span class="n">unique_values</span><span class="p">:</span>
+</span><span id="L-274"><a href="#L-274"><span class="linenos">274</span></a>                <span class="n">unique_values</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">missing_symbol</span><span class="p">)</span>
 </span><span id="L-275"><a href="#L-275"><span class="linenos">275</span></a>
-</span><span id="L-276"><a href="#L-276"><span class="linenos">276</span></a><span class="k">def</span> <span class="nf">compute_subfeatures</span><span class="p">(</span>
-</span><span id="L-277"><a href="#L-277"><span class="linenos">277</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="L-278"><a href="#L-278"><span class="linenos">278</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="L-279"><a href="#L-279"><span class="linenos">279</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute derived features that are more fine-grained. Implements logic around two operators that govern feature construction.</span>
-</span><span id="L-280"><a href="#L-280"><span class="linenos">280</span></a><span class="sd">    -&gt;: One sided construction - every value from left side is fine, separate ones from the right side feature will be considered.</span>
-</span><span id="L-281"><a href="#L-281"><span class="linenos">281</span></a><span class="sd">    &lt;-&gt;: Two sided construction - two-sided values present. This means that each value from a is combined with each from b, forming |A|*|B| new features (one-hot encoded)</span>
-</span><span id="L-282"><a href="#L-282"><span class="linenos">282</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-276"><a href="#L-276"><span class="linenos">276</span></a>        <span class="k">for</span> <span class="n">unique_value</span> <span class="ow">in</span> <span class="n">unique_values</span><span class="p">:</span>
+</span><span id="L-277"><a href="#L-277"><span class="linenos">277</span></a>            <span class="n">tmp_vec</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-278"><a href="#L-278"><span class="linenos">278</span></a>            <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">multivalue</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">multivalue_sets</span><span class="p">):</span>
+</span><span id="L-279"><a href="#L-279"><span class="linenos">279</span></a>                <span class="k">if</span> <span class="n">unique_value</span> <span class="ow">in</span> <span class="n">multivalue</span><span class="p">:</span>
+</span><span id="L-280"><a href="#L-280"><span class="linenos">280</span></a>                    <span class="n">tmp_vec</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="s1">&#39;1&#39;</span><span class="p">)</span>
+</span><span id="L-281"><a href="#L-281"><span class="linenos">281</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="L-282"><a href="#L-282"><span class="linenos">282</span></a>                    <span class="n">tmp_vec</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
 </span><span id="L-283"><a href="#L-283"><span class="linenos">283</span></a>
-</span><span id="L-284"><a href="#L-284"><span class="linenos">284</span></a>    <span class="n">all_subfeature_pair_seeds</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">subfeature_mapping</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;;&#39;</span><span class="p">)</span>
-</span><span id="L-285"><a href="#L-285"><span class="linenos">285</span></a>    <span class="n">new_feature_hash</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
-</span><span id="L-286"><a href="#L-286"><span class="linenos">286</span></a>
-</span><span id="L-287"><a href="#L-287"><span class="linenos">287</span></a>    <span class="k">for</span> <span class="n">seed_pair</span> <span class="ow">in</span> <span class="n">all_subfeature_pair_seeds</span><span class="p">:</span>
-</span><span id="L-288"><a href="#L-288"><span class="linenos">288</span></a>        <span class="k">if</span> <span class="s1">&#39;&lt;-&gt;&#39;</span> <span class="ow">in</span> <span class="n">seed_pair</span><span class="p">:</span>
-</span><span id="L-289"><a href="#L-289"><span class="linenos">289</span></a>            <span class="n">feature_first</span><span class="p">,</span> <span class="n">feature_second</span> <span class="o">=</span> <span class="n">seed_pair</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;&lt;-&gt;&#39;</span><span class="p">)</span>
-</span><span id="L-290"><a href="#L-290"><span class="linenos">290</span></a>
-</span><span id="L-291"><a href="#L-291"><span class="linenos">291</span></a>        <span class="k">elif</span> <span class="s1">&#39;-&gt;&#39;</span> <span class="ow">in</span> <span class="n">seed_pair</span><span class="p">:</span>
-</span><span id="L-292"><a href="#L-292"><span class="linenos">292</span></a>            <span class="n">feature_first</span><span class="p">,</span> <span class="n">feature_second</span> <span class="o">=</span> <span class="n">seed_pair</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;-&gt;&#39;</span><span class="p">)</span>
-</span><span id="L-293"><a href="#L-293"><span class="linenos">293</span></a>
-</span><span id="L-294"><a href="#L-294"><span class="linenos">294</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-295"><a href="#L-295"><span class="linenos">295</span></a>            <span class="k">raise</span> <span class="ne">NotImplementedError</span><span class="p">(</span>
-</span><span id="L-296"><a href="#L-296"><span class="linenos">296</span></a>                <span class="s1">&#39;Please specify valid subfeature operator (&lt;-&gt; or -&gt;)&#39;</span><span class="p">,</span>
-</span><span id="L-297"><a href="#L-297"><span class="linenos">297</span></a>            <span class="p">)</span>
-</span><span id="L-298"><a href="#L-298"><span class="linenos">298</span></a>
-</span><span id="L-299"><a href="#L-299"><span class="linenos">299</span></a>        <span class="n">subframe</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[[</span><span class="n">feature_first</span><span class="p">,</span> <span class="n">feature_second</span><span class="p">]]</span>
-</span><span id="L-300"><a href="#L-300"><span class="linenos">300</span></a>        <span class="n">unique_feature_second</span> <span class="o">=</span> <span class="n">subframe</span><span class="p">[</span><span class="n">feature_second</span><span class="p">]</span><span class="o">.</span><span class="n">unique</span><span class="p">()</span>
-</span><span id="L-301"><a href="#L-301"><span class="linenos">301</span></a>        <span class="n">feature_first_vec</span> <span class="o">=</span> <span class="n">subframe</span><span class="p">[</span><span class="n">feature_first</span><span class="p">]</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="L-302"><a href="#L-302"><span class="linenos">302</span></a>        <span class="n">feature_second_vec</span> <span class="o">=</span> <span class="n">subframe</span><span class="p">[</span><span class="n">feature_second</span><span class="p">]</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="L-303"><a href="#L-303"><span class="linenos">303</span></a>        <span class="n">out_template_feature</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="L-304"><a href="#L-304"><span class="linenos">304</span></a>            <span class="p">(</span><span class="n">a</span><span class="p">,</span> <span class="n">b</span><span class="p">)</span> <span class="k">for</span> <span class="n">a</span><span class="p">,</span> <span class="n">b</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">feature_first_vec</span><span class="p">,</span> <span class="n">feature_second_vec</span><span class="p">)</span>
-</span><span id="L-305"><a href="#L-305"><span class="linenos">305</span></a>        <span class="p">]</span>
-</span><span id="L-306"><a href="#L-306"><span class="linenos">306</span></a>
-</span><span id="L-307"><a href="#L-307"><span class="linenos">307</span></a>        <span class="k">if</span> <span class="s1">&#39;&lt;-&gt;&#39;</span> <span class="ow">in</span> <span class="n">seed_pair</span><span class="p">:</span>
-</span><span id="L-308"><a href="#L-308"><span class="linenos">308</span></a>            <span class="n">unique_feature_first</span> <span class="o">=</span> <span class="n">subframe</span><span class="p">[</span><span class="n">feature_first</span><span class="p">]</span><span class="o">.</span><span class="n">unique</span><span class="p">()</span>
-</span><span id="L-309"><a href="#L-309"><span class="linenos">309</span></a>
-</span><span id="L-310"><a href="#L-310"><span class="linenos">310</span></a>            <span class="n">mask_types</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-311"><a href="#L-311"><span class="linenos">311</span></a>            <span class="k">for</span> <span class="n">unique_target_feature_value</span> <span class="ow">in</span> <span class="n">unique_feature_second</span><span class="p">:</span>
-</span><span id="L-312"><a href="#L-312"><span class="linenos">312</span></a>                <span class="k">for</span> <span class="n">unique_seed_feature_value</span> <span class="ow">in</span> <span class="n">unique_feature_first</span><span class="p">:</span>
-</span><span id="L-313"><a href="#L-313"><span class="linenos">313</span></a>                    <span class="n">mask_types</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-</span><span id="L-314"><a href="#L-314"><span class="linenos">314</span></a>                        <span class="p">(</span><span class="n">unique_seed_feature_value</span><span class="p">,</span> <span class="n">unique_target_feature_value</span><span class="p">),</span>
-</span><span id="L-315"><a href="#L-315"><span class="linenos">315</span></a>                    <span class="p">)</span>
-</span><span id="L-316"><a href="#L-316"><span class="linenos">316</span></a>
-</span><span id="L-317"><a href="#L-317"><span class="linenos">317</span></a>            <span class="k">for</span> <span class="n">mask_type</span> <span class="ow">in</span> <span class="n">mask_types</span><span class="p">:</span>
-</span><span id="L-318"><a href="#L-318"><span class="linenos">318</span></a>                <span class="n">new_feature</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-319"><a href="#L-319"><span class="linenos">319</span></a>                <span class="k">for</span> <span class="n">value_tuple</span> <span class="ow">in</span> <span class="n">out_template_feature</span><span class="p">:</span>
-</span><span id="L-320"><a href="#L-320"><span class="linenos">320</span></a>                    <span class="k">if</span> <span class="p">(</span>
-</span><span id="L-321"><a href="#L-321"><span class="linenos">321</span></a>                        <span class="n">value_tuple</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="n">mask_type</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="L-322"><a href="#L-322"><span class="linenos">322</span></a>                        <span class="ow">and</span> <span class="n">value_tuple</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">==</span> <span class="n">mask_type</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="L-323"><a href="#L-323"><span class="linenos">323</span></a>                    <span class="p">):</span>
-</span><span id="L-324"><a href="#L-324"><span class="linenos">324</span></a>                        <span class="n">new_feature</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="mi">1</span><span class="p">))</span>
-</span><span id="L-325"><a href="#L-325"><span class="linenos">325</span></a>                    <span class="k">else</span><span class="p">:</span>
-</span><span id="L-326"><a href="#L-326"><span class="linenos">326</span></a>                        <span class="n">new_feature</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="mi">0</span><span class="p">))</span>
-</span><span id="L-327"><a href="#L-327"><span class="linenos">327</span></a>                <span class="n">feature_name</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="L-328"><a href="#L-328"><span class="linenos">328</span></a>                    <span class="sa">f</span><span class="s1">&#39;SUBFEATURE|</span><span class="si">{</span><span class="n">feature_first</span><span class="si">}</span><span class="s1">|</span><span class="si">{</span><span class="n">feature_second</span><span class="si">}</span><span class="s1">-&#39;</span>
-</span><span id="L-329"><a href="#L-329"><span class="linenos">329</span></a>                    <span class="o">+</span> <span class="n">mask_type</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="L-330"><a href="#L-330"><span class="linenos">330</span></a>                    <span class="o">+</span> <span class="s1">&#39;&amp;&#39;</span>
-</span><span id="L-331"><a href="#L-331"><span class="linenos">331</span></a>                    <span class="o">+</span> <span class="n">mask_type</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="L-332"><a href="#L-332"><span class="linenos">332</span></a>                <span class="p">)</span>
-</span><span id="L-333"><a href="#L-333"><span class="linenos">333</span></a>                <span class="n">new_feature_hash</span><span class="p">[</span><span class="n">feature_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_feature</span>
-</span><span id="L-334"><a href="#L-334"><span class="linenos">334</span></a>
-</span><span id="L-335"><a href="#L-335"><span class="linenos">335</span></a>            <span class="k">del</span> <span class="n">new_feature</span>
-</span><span id="L-336"><a href="#L-336"><span class="linenos">336</span></a>
-</span><span id="L-337"><a href="#L-337"><span class="linenos">337</span></a>        <span class="k">elif</span> <span class="s1">&#39;-&gt;&#39;</span> <span class="ow">in</span> <span class="n">seed_pair</span><span class="p">:</span>
-</span><span id="L-338"><a href="#L-338"><span class="linenos">338</span></a>            <span class="k">for</span> <span class="n">unique_target_feature_value</span> <span class="ow">in</span> <span class="n">unique_feature_second</span><span class="p">:</span>
-</span><span id="L-339"><a href="#L-339"><span class="linenos">339</span></a>                <span class="n">tmp_new_feature</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="L-340"><a href="#L-340"><span class="linenos">340</span></a>                    <span class="s1">&#39;AND&#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
-</span><span id="L-341"><a href="#L-341"><span class="linenos">341</span></a>                        <span class="n">x</span><span class="p">,</span>
-</span><span id="L-342"><a href="#L-342"><span class="linenos">342</span></a>                    <span class="p">)</span> <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">==</span> <span class="n">unique_target_feature_value</span> <span class="k">else</span> <span class="s1">&#39;&#39;</span>
-</span><span id="L-343"><a href="#L-343"><span class="linenos">343</span></a>                    <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">out_template_feature</span>
-</span><span id="L-344"><a href="#L-344"><span class="linenos">344</span></a>                <span class="p">]</span>
-</span><span id="L-345"><a href="#L-345"><span class="linenos">345</span></a>                <span class="n">feature_name_final</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="L-346"><a href="#L-346"><span class="linenos">346</span></a>                    <span class="s1">&#39;SUBFEATURE-&#39;</span> <span class="o">+</span> <span class="n">feature_first</span> <span class="o">+</span> <span class="s1">&#39;&amp;&#39;</span> <span class="o">+</span> <span class="n">unique_target_feature_value</span>
-</span><span id="L-347"><a href="#L-347"><span class="linenos">347</span></a>                <span class="p">)</span>
-</span><span id="L-348"><a href="#L-348"><span class="linenos">348</span></a>                <span class="n">new_feature_hash</span><span class="p">[</span><span class="n">feature_name_final</span><span class="p">]</span> <span class="o">=</span> <span class="n">tmp_new_feature</span>
-</span><span id="L-349"><a href="#L-349"><span class="linenos">349</span></a>
-</span><span id="L-350"><a href="#L-350"><span class="linenos">350</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">new_feature_hash</span><span class="p">)</span>
-</span><span id="L-351"><a href="#L-351"><span class="linenos">351</span></a>    <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">([</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="L-352"><a href="#L-352"><span class="linenos">352</span></a>
-</span><span id="L-353"><a href="#L-353"><span class="linenos">353</span></a>    <span class="k">del</span> <span class="n">tmp_df</span>
-</span><span id="L-354"><a href="#L-354"><span class="linenos">354</span></a>    <span class="k">return</span> <span class="n">input_dataframe</span>
-</span><span id="L-355"><a href="#L-355"><span class="linenos">355</span></a>
-</span><span id="L-356"><a href="#L-356"><span class="linenos">356</span></a>
-</span><span id="L-357"><a href="#L-357"><span class="linenos">357</span></a><span class="k">def</span> <span class="nf">include_noisy_features</span><span class="p">(</span>
-</span><span id="L-358"><a href="#L-358"><span class="linenos">358</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="L-359"><a href="#L-359"><span class="linenos">359</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="L-360"><a href="#L-360"><span class="linenos">360</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Add randomized features that serve as a sanity check&quot;&quot;&quot;</span>
-</span><span id="L-361"><a href="#L-361"><span class="linenos">361</span></a>
-</span><span id="L-362"><a href="#L-362"><span class="linenos">362</span></a>    <span class="n">transformer</span> <span class="o">=</span> <span class="n">FeatureTransformerNoise</span><span class="p">()</span>
-</span><span id="L-363"><a href="#L-363"><span class="linenos">363</span></a>    <span class="n">transformed_df</span> <span class="o">=</span> <span class="n">transformer</span><span class="o">.</span><span class="n">construct_new_features</span><span class="p">(</span>
-</span><span id="L-364"><a href="#L-364"><span class="linenos">364</span></a>        <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span><span class="p">,</span>
-</span><span id="L-365"><a href="#L-365"><span class="linenos">365</span></a>    <span class="p">)</span>
+</span><span id="L-284"><a href="#L-284"><span class="linenos">284</span></a>            <span class="n">new_feature_hash</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;MULTIEX-</span><span class="si">{</span><span class="n">multivalue_feature</span><span class="si">}</span><span class="s1">-</span><span class="si">{</span><span class="n">unique_value</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tmp_vec</span>
+</span><span id="L-285"><a href="#L-285"><span class="linenos">285</span></a>
+</span><span id="L-286"><a href="#L-286"><span class="linenos">286</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">new_feature_hash</span><span class="p">)</span>
+</span><span id="L-287"><a href="#L-287"><span class="linenos">287</span></a>    <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">([</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-288"><a href="#L-288"><span class="linenos">288</span></a>    <span class="k">del</span> <span class="n">tmp_df</span>
+</span><span id="L-289"><a href="#L-289"><span class="linenos">289</span></a>
+</span><span id="L-290"><a href="#L-290"><span class="linenos">290</span></a>    <span class="k">return</span> <span class="n">input_dataframe</span>
+</span><span id="L-291"><a href="#L-291"><span class="linenos">291</span></a>
+</span><span id="L-292"><a href="#L-292"><span class="linenos">292</span></a>
+</span><span id="L-293"><a href="#L-293"><span class="linenos">293</span></a><span class="k">def</span> <span class="nf">compute_subfeatures</span><span class="p">(</span>
+</span><span id="L-294"><a href="#L-294"><span class="linenos">294</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="L-295"><a href="#L-295"><span class="linenos">295</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="L-296"><a href="#L-296"><span class="linenos">296</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute derived features that are more fine-grained. Implements logic around two operators that govern feature construction.</span>
+</span><span id="L-297"><a href="#L-297"><span class="linenos">297</span></a><span class="sd">    -&gt;: One sided construction - every value from left side is fine, separate ones from the right side feature will be considered.</span>
+</span><span id="L-298"><a href="#L-298"><span class="linenos">298</span></a><span class="sd">    &lt;-&gt;: Two sided construction - two-sided values present. This means that each value from a is combined with each from b, forming |A|*|B| new features (one-hot encoded)</span>
+</span><span id="L-299"><a href="#L-299"><span class="linenos">299</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-300"><a href="#L-300"><span class="linenos">300</span></a>
+</span><span id="L-301"><a href="#L-301"><span class="linenos">301</span></a>    <span class="n">all_subfeature_pair_seeds</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">subfeature_mapping</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;;&#39;</span><span class="p">)</span>
+</span><span id="L-302"><a href="#L-302"><span class="linenos">302</span></a>    <span class="n">new_feature_hash</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
+</span><span id="L-303"><a href="#L-303"><span class="linenos">303</span></a>
+</span><span id="L-304"><a href="#L-304"><span class="linenos">304</span></a>    <span class="k">for</span> <span class="n">seed_pair</span> <span class="ow">in</span> <span class="n">all_subfeature_pair_seeds</span><span class="p">:</span>
+</span><span id="L-305"><a href="#L-305"><span class="linenos">305</span></a>        <span class="k">if</span> <span class="s1">&#39;&lt;-&gt;&#39;</span> <span class="ow">in</span> <span class="n">seed_pair</span><span class="p">:</span>
+</span><span id="L-306"><a href="#L-306"><span class="linenos">306</span></a>            <span class="n">feature_first</span><span class="p">,</span> <span class="n">feature_second</span> <span class="o">=</span> <span class="n">seed_pair</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;&lt;-&gt;&#39;</span><span class="p">)</span>
+</span><span id="L-307"><a href="#L-307"><span class="linenos">307</span></a>
+</span><span id="L-308"><a href="#L-308"><span class="linenos">308</span></a>        <span class="k">elif</span> <span class="s1">&#39;-&gt;&#39;</span> <span class="ow">in</span> <span class="n">seed_pair</span><span class="p">:</span>
+</span><span id="L-309"><a href="#L-309"><span class="linenos">309</span></a>            <span class="n">feature_first</span><span class="p">,</span> <span class="n">feature_second</span> <span class="o">=</span> <span class="n">seed_pair</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;-&gt;&#39;</span><span class="p">)</span>
+</span><span id="L-310"><a href="#L-310"><span class="linenos">310</span></a>
+</span><span id="L-311"><a href="#L-311"><span class="linenos">311</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-312"><a href="#L-312"><span class="linenos">312</span></a>            <span class="k">raise</span> <span class="ne">NotImplementedError</span><span class="p">(</span>
+</span><span id="L-313"><a href="#L-313"><span class="linenos">313</span></a>                <span class="s1">&#39;Please specify valid subfeature operator (&lt;-&gt; or -&gt;)&#39;</span><span class="p">,</span>
+</span><span id="L-314"><a href="#L-314"><span class="linenos">314</span></a>            <span class="p">)</span>
+</span><span id="L-315"><a href="#L-315"><span class="linenos">315</span></a>
+</span><span id="L-316"><a href="#L-316"><span class="linenos">316</span></a>        <span class="n">subframe</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[[</span><span class="n">feature_first</span><span class="p">,</span> <span class="n">feature_second</span><span class="p">]]</span>
+</span><span id="L-317"><a href="#L-317"><span class="linenos">317</span></a>        <span class="n">unique_feature_second</span> <span class="o">=</span> <span class="n">subframe</span><span class="p">[</span><span class="n">feature_second</span><span class="p">]</span><span class="o">.</span><span class="n">unique</span><span class="p">()</span>
+</span><span id="L-318"><a href="#L-318"><span class="linenos">318</span></a>        <span class="n">feature_first_vec</span> <span class="o">=</span> <span class="n">subframe</span><span class="p">[</span><span class="n">feature_first</span><span class="p">]</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="L-319"><a href="#L-319"><span class="linenos">319</span></a>        <span class="n">feature_second_vec</span> <span class="o">=</span> <span class="n">subframe</span><span class="p">[</span><span class="n">feature_second</span><span class="p">]</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="L-320"><a href="#L-320"><span class="linenos">320</span></a>        <span class="n">out_template_feature</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="L-321"><a href="#L-321"><span class="linenos">321</span></a>            <span class="p">(</span><span class="n">a</span><span class="p">,</span> <span class="n">b</span><span class="p">)</span> <span class="k">for</span> <span class="n">a</span><span class="p">,</span> <span class="n">b</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">feature_first_vec</span><span class="p">,</span> <span class="n">feature_second_vec</span><span class="p">)</span>
+</span><span id="L-322"><a href="#L-322"><span class="linenos">322</span></a>        <span class="p">]</span>
+</span><span id="L-323"><a href="#L-323"><span class="linenos">323</span></a>
+</span><span id="L-324"><a href="#L-324"><span class="linenos">324</span></a>        <span class="k">if</span> <span class="s1">&#39;&lt;-&gt;&#39;</span> <span class="ow">in</span> <span class="n">seed_pair</span><span class="p">:</span>
+</span><span id="L-325"><a href="#L-325"><span class="linenos">325</span></a>            <span class="n">unique_feature_first</span> <span class="o">=</span> <span class="n">subframe</span><span class="p">[</span><span class="n">feature_first</span><span class="p">]</span><span class="o">.</span><span class="n">unique</span><span class="p">()</span>
+</span><span id="L-326"><a href="#L-326"><span class="linenos">326</span></a>
+</span><span id="L-327"><a href="#L-327"><span class="linenos">327</span></a>            <span class="n">mask_types</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-328"><a href="#L-328"><span class="linenos">328</span></a>            <span class="k">for</span> <span class="n">unique_target_feature_value</span> <span class="ow">in</span> <span class="n">unique_feature_second</span><span class="p">:</span>
+</span><span id="L-329"><a href="#L-329"><span class="linenos">329</span></a>                <span class="k">for</span> <span class="n">unique_seed_feature_value</span> <span class="ow">in</span> <span class="n">unique_feature_first</span><span class="p">:</span>
+</span><span id="L-330"><a href="#L-330"><span class="linenos">330</span></a>                    <span class="n">mask_types</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
+</span><span id="L-331"><a href="#L-331"><span class="linenos">331</span></a>                        <span class="p">(</span><span class="n">unique_seed_feature_value</span><span class="p">,</span> <span class="n">unique_target_feature_value</span><span class="p">),</span>
+</span><span id="L-332"><a href="#L-332"><span class="linenos">332</span></a>                    <span class="p">)</span>
+</span><span id="L-333"><a href="#L-333"><span class="linenos">333</span></a>
+</span><span id="L-334"><a href="#L-334"><span class="linenos">334</span></a>            <span class="k">for</span> <span class="n">mask_type</span> <span class="ow">in</span> <span class="n">mask_types</span><span class="p">:</span>
+</span><span id="L-335"><a href="#L-335"><span class="linenos">335</span></a>                <span class="n">new_feature</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-336"><a href="#L-336"><span class="linenos">336</span></a>                <span class="k">for</span> <span class="n">value_tuple</span> <span class="ow">in</span> <span class="n">out_template_feature</span><span class="p">:</span>
+</span><span id="L-337"><a href="#L-337"><span class="linenos">337</span></a>                    <span class="k">if</span> <span class="p">(</span>
+</span><span id="L-338"><a href="#L-338"><span class="linenos">338</span></a>                        <span class="n">value_tuple</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="n">mask_type</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="L-339"><a href="#L-339"><span class="linenos">339</span></a>                        <span class="ow">and</span> <span class="n">value_tuple</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">==</span> <span class="n">mask_type</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="L-340"><a href="#L-340"><span class="linenos">340</span></a>                    <span class="p">):</span>
+</span><span id="L-341"><a href="#L-341"><span class="linenos">341</span></a>                        <span class="n">new_feature</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="L-342"><a href="#L-342"><span class="linenos">342</span></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="L-343"><a href="#L-343"><span class="linenos">343</span></a>                        <span class="n">new_feature</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="mi">0</span><span class="p">))</span>
+</span><span id="L-344"><a href="#L-344"><span class="linenos">344</span></a>                <span class="n">feature_name</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="L-345"><a href="#L-345"><span class="linenos">345</span></a>                    <span class="sa">f</span><span class="s1">&#39;SUBFEATURE|</span><span class="si">{</span><span class="n">feature_first</span><span class="si">}</span><span class="s1">|</span><span class="si">{</span><span class="n">feature_second</span><span class="si">}</span><span class="s1">-&#39;</span>
+</span><span id="L-346"><a href="#L-346"><span class="linenos">346</span></a>                    <span class="o">+</span> <span class="n">mask_type</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="L-347"><a href="#L-347"><span class="linenos">347</span></a>                    <span class="o">+</span> <span class="s1">&#39;&amp;&#39;</span>
+</span><span id="L-348"><a href="#L-348"><span class="linenos">348</span></a>                    <span class="o">+</span> <span class="n">mask_type</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="L-349"><a href="#L-349"><span class="linenos">349</span></a>                <span class="p">)</span>
+</span><span id="L-350"><a href="#L-350"><span class="linenos">350</span></a>                <span class="n">new_feature_hash</span><span class="p">[</span><span class="n">feature_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_feature</span>
+</span><span id="L-351"><a href="#L-351"><span class="linenos">351</span></a>
+</span><span id="L-352"><a href="#L-352"><span class="linenos">352</span></a>            <span class="k">del</span> <span class="n">new_feature</span>
+</span><span id="L-353"><a href="#L-353"><span class="linenos">353</span></a>
+</span><span id="L-354"><a href="#L-354"><span class="linenos">354</span></a>        <span class="k">elif</span> <span class="s1">&#39;-&gt;&#39;</span> <span class="ow">in</span> <span class="n">seed_pair</span><span class="p">:</span>
+</span><span id="L-355"><a href="#L-355"><span class="linenos">355</span></a>            <span class="k">for</span> <span class="n">unique_target_feature_value</span> <span class="ow">in</span> <span class="n">unique_feature_second</span><span class="p">:</span>
+</span><span id="L-356"><a href="#L-356"><span class="linenos">356</span></a>                <span class="n">tmp_new_feature</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="L-357"><a href="#L-357"><span class="linenos">357</span></a>                    <span class="s1">&#39;AND&#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
+</span><span id="L-358"><a href="#L-358"><span class="linenos">358</span></a>                        <span class="n">x</span><span class="p">,</span>
+</span><span id="L-359"><a href="#L-359"><span class="linenos">359</span></a>                    <span class="p">)</span> <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">==</span> <span class="n">unique_target_feature_value</span> <span class="k">else</span> <span class="s1">&#39;&#39;</span>
+</span><span id="L-360"><a href="#L-360"><span class="linenos">360</span></a>                    <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">out_template_feature</span>
+</span><span id="L-361"><a href="#L-361"><span class="linenos">361</span></a>                <span class="p">]</span>
+</span><span id="L-362"><a href="#L-362"><span class="linenos">362</span></a>                <span class="n">feature_name_final</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="L-363"><a href="#L-363"><span class="linenos">363</span></a>                    <span class="s1">&#39;SUBFEATURE-&#39;</span> <span class="o">+</span> <span class="n">feature_first</span> <span class="o">+</span> <span class="s1">&#39;&amp;&#39;</span> <span class="o">+</span> <span class="n">unique_target_feature_value</span>
+</span><span id="L-364"><a href="#L-364"><span class="linenos">364</span></a>                <span class="p">)</span>
+</span><span id="L-365"><a href="#L-365"><span class="linenos">365</span></a>                <span class="n">new_feature_hash</span><span class="p">[</span><span class="n">feature_name_final</span><span class="p">]</span> <span class="o">=</span> <span class="n">tmp_new_feature</span>
 </span><span id="L-366"><a href="#L-366"><span class="linenos">366</span></a>
-</span><span id="L-367"><a href="#L-367"><span class="linenos">367</span></a>    <span class="k">return</span> <span class="n">transformed_df</span>
-</span><span id="L-368"><a href="#L-368"><span class="linenos">368</span></a>
+</span><span id="L-367"><a href="#L-367"><span class="linenos">367</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">new_feature_hash</span><span class="p">)</span>
+</span><span id="L-368"><a href="#L-368"><span class="linenos">368</span></a>    <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">([</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
 </span><span id="L-369"><a href="#L-369"><span class="linenos">369</span></a>
-</span><span id="L-370"><a href="#L-370"><span class="linenos">370</span></a><span class="k">def</span> <span class="nf">compute_coverage</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
-</span><span id="L-371"><a href="#L-371"><span class="linenos">371</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute coverage of features, incrementally&quot;&quot;&quot;</span>
-</span><span id="L-372"><a href="#L-372"><span class="linenos">372</span></a>    <span class="n">output_storage_cov</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">set</span><span class="p">)</span>
-</span><span id="L-373"><a href="#L-373"><span class="linenos">373</span></a>    <span class="n">all_missing_symbols</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">missing_value_symbols</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))</span>
-</span><span id="L-374"><a href="#L-374"><span class="linenos">374</span></a>    <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="p">:</span>
-</span><span id="L-375"><a href="#L-375"><span class="linenos">375</span></a>        <span class="n">all_missing</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">(</span>
-</span><span id="L-376"><a href="#L-376"><span class="linenos">376</span></a>            <span class="p">[</span>
-</span><span id="L-377"><a href="#L-377"><span class="linenos">377</span></a>                <span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
-</span><span id="L-378"><a href="#L-378"><span class="linenos">378</span></a>                <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">all_missing_symbols</span>
-</span><span id="L-379"><a href="#L-379"><span class="linenos">379</span></a>            <span class="p">],</span>
-</span><span id="L-380"><a href="#L-380"><span class="linenos">380</span></a>        <span class="p">)</span>
-</span><span id="L-381"><a href="#L-381"><span class="linenos">381</span></a>
-</span><span id="L-382"><a href="#L-382"><span class="linenos">382</span></a>        <span class="n">output_storage_cov</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="L-383"><a href="#L-383"><span class="linenos">383</span></a>            <span class="mi">1</span> <span class="o">-</span> <span class="p">(</span><span class="n">all_missing</span> <span class="o">/</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
-</span><span id="L-384"><a href="#L-384"><span class="linenos">384</span></a>        <span class="p">)</span> <span class="o">*</span> <span class="mi">100</span>
+</span><span id="L-370"><a href="#L-370"><span class="linenos">370</span></a>    <span class="k">del</span> <span class="n">tmp_df</span>
+</span><span id="L-371"><a href="#L-371"><span class="linenos">371</span></a>    <span class="k">return</span> <span class="n">input_dataframe</span>
+</span><span id="L-372"><a href="#L-372"><span class="linenos">372</span></a>
+</span><span id="L-373"><a href="#L-373"><span class="linenos">373</span></a>
+</span><span id="L-374"><a href="#L-374"><span class="linenos">374</span></a><span class="k">def</span> <span class="nf">include_noisy_features</span><span class="p">(</span>
+</span><span id="L-375"><a href="#L-375"><span class="linenos">375</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="L-376"><a href="#L-376"><span class="linenos">376</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="L-377"><a href="#L-377"><span class="linenos">377</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Add randomized features that serve as a sanity check&quot;&quot;&quot;</span>
+</span><span id="L-378"><a href="#L-378"><span class="linenos">378</span></a>
+</span><span id="L-379"><a href="#L-379"><span class="linenos">379</span></a>    <span class="n">transformer</span> <span class="o">=</span> <span class="n">FeatureTransformerNoise</span><span class="p">()</span>
+</span><span id="L-380"><a href="#L-380"><span class="linenos">380</span></a>    <span class="n">transformed_df</span> <span class="o">=</span> <span class="n">transformer</span><span class="o">.</span><span class="n">construct_new_features</span><span class="p">(</span>
+</span><span id="L-381"><a href="#L-381"><span class="linenos">381</span></a>        <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span><span class="p">,</span>
+</span><span id="L-382"><a href="#L-382"><span class="linenos">382</span></a>    <span class="p">)</span>
+</span><span id="L-383"><a href="#L-383"><span class="linenos">383</span></a>
+</span><span id="L-384"><a href="#L-384"><span class="linenos">384</span></a>    <span class="k">return</span> <span class="n">transformed_df</span>
 </span><span id="L-385"><a href="#L-385"><span class="linenos">385</span></a>
-</span><span id="L-386"><a href="#L-386"><span class="linenos">386</span></a>    <span class="k">return</span> <span class="n">output_storage_cov</span>
-</span><span id="L-387"><a href="#L-387"><span class="linenos">387</span></a>
-</span><span id="L-388"><a href="#L-388"><span class="linenos">388</span></a>
-</span><span id="L-389"><a href="#L-389"><span class="linenos">389</span></a><span class="k">def</span> <span class="nf">compute_feature_memory_consumption</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
-</span><span id="L-390"><a href="#L-390"><span class="linenos">390</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;An approximation of how much feature take up&quot;&quot;&quot;</span>
-</span><span id="L-391"><a href="#L-391"><span class="linenos">391</span></a>    <span class="n">output_storage_features</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">set</span><span class="p">)</span>
-</span><span id="L-392"><a href="#L-392"><span class="linenos">392</span></a>    <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
-</span><span id="L-393"><a href="#L-393"><span class="linenos">393</span></a>        <span class="n">specific_column</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="L-394"><a href="#L-394"><span class="linenos">394</span></a>            <span class="nb">str</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">col</span><span class="p">]</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">str</span><span class="p">)</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="L-395"><a href="#L-395"><span class="linenos">395</span></a>        <span class="p">]</span>
-</span><span id="L-396"><a href="#L-396"><span class="linenos">396</span></a>        <span class="n">col_size</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">(</span>
-</span><span id="L-397"><a href="#L-397"><span class="linenos">397</span></a>            <span class="nb">len</span><span class="p">(</span><span class="n">x</span><span class="o">.</span><span class="n">encode</span><span class="p">())</span>
-</span><span id="L-398"><a href="#L-398"><span class="linenos">398</span></a>            <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">specific_column</span>
-</span><span id="L-399"><a href="#L-399"><span class="linenos">399</span></a>        <span class="p">)</span> <span class="o">/</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="L-400"><a href="#L-400"><span class="linenos">400</span></a>        <span class="n">output_storage_features</span><span class="p">[</span><span class="n">col</span><span class="p">]</span> <span class="o">=</span> <span class="n">col_size</span>
-</span><span id="L-401"><a href="#L-401"><span class="linenos">401</span></a>    <span class="k">return</span> <span class="n">output_storage_features</span>
+</span><span id="L-386"><a href="#L-386"><span class="linenos">386</span></a>
+</span><span id="L-387"><a href="#L-387"><span class="linenos">387</span></a><span class="k">def</span> <span class="nf">compute_coverage</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
+</span><span id="L-388"><a href="#L-388"><span class="linenos">388</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute coverage of features, incrementally&quot;&quot;&quot;</span>
+</span><span id="L-389"><a href="#L-389"><span class="linenos">389</span></a>    <span class="n">output_storage_cov</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">set</span><span class="p">)</span>
+</span><span id="L-390"><a href="#L-390"><span class="linenos">390</span></a>    <span class="n">all_missing_symbols</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">missing_value_symbols</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))</span>
+</span><span id="L-391"><a href="#L-391"><span class="linenos">391</span></a>    <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="p">:</span>
+</span><span id="L-392"><a href="#L-392"><span class="linenos">392</span></a>        <span class="n">all_missing</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">(</span>
+</span><span id="L-393"><a href="#L-393"><span class="linenos">393</span></a>            <span class="p">[</span>
+</span><span id="L-394"><a href="#L-394"><span class="linenos">394</span></a>                <span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="L-395"><a href="#L-395"><span class="linenos">395</span></a>                <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">all_missing_symbols</span>
+</span><span id="L-396"><a href="#L-396"><span class="linenos">396</span></a>            <span class="p">],</span>
+</span><span id="L-397"><a href="#L-397"><span class="linenos">397</span></a>        <span class="p">)</span>
+</span><span id="L-398"><a href="#L-398"><span class="linenos">398</span></a>
+</span><span id="L-399"><a href="#L-399"><span class="linenos">399</span></a>        <span class="n">output_storage_cov</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="L-400"><a href="#L-400"><span class="linenos">400</span></a>            <span class="mi">1</span> <span class="o">-</span> <span class="p">(</span><span class="n">all_missing</span> <span class="o">/</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="L-401"><a href="#L-401"><span class="linenos">401</span></a>        <span class="p">)</span> <span class="o">*</span> <span class="mi">100</span>
 </span><span id="L-402"><a href="#L-402"><span class="linenos">402</span></a>
-</span><span id="L-403"><a href="#L-403"><span class="linenos">403</span></a>
-</span><span id="L-404"><a href="#L-404"><span class="linenos">404</span></a><span class="k">def</span> <span class="nf">compute_value_counts</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">):</span>
-</span><span id="L-405"><a href="#L-405"><span class="linenos">405</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Update the count structure&quot;&quot;&quot;</span>
-</span><span id="L-406"><a href="#L-406"><span class="linenos">406</span></a>
-</span><span id="L-407"><a href="#L-407"><span class="linenos">407</span></a>    <span class="k">global</span> <span class="n">GLOBAL_RARE_VALUE_STORAGE</span>
-</span><span id="L-408"><a href="#L-408"><span class="linenos">408</span></a>    <span class="k">global</span> <span class="n">IGNORED_VALUES</span>
-</span><span id="L-409"><a href="#L-409"><span class="linenos">409</span></a>
-</span><span id="L-410"><a href="#L-410"><span class="linenos">410</span></a>    <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
-</span><span id="L-411"><a href="#L-411"><span class="linenos">411</span></a>        <span class="n">main_values</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
-</span><span id="L-412"><a href="#L-412"><span class="linenos">412</span></a>        <span class="k">for</span> <span class="n">value</span> <span class="ow">in</span> <span class="n">main_values</span><span class="p">:</span>
-</span><span id="L-413"><a href="#L-413"><span class="linenos">413</span></a>            <span class="k">if</span> <span class="n">value</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">IGNORED_VALUES</span><span class="p">:</span>
-</span><span id="L-414"><a href="#L-414"><span class="linenos">414</span></a>                <span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="o">.</span><span class="n">update</span><span class="p">({(</span><span class="n">column</span><span class="p">,</span> <span class="n">value</span><span class="p">):</span> <span class="mi">1</span><span class="p">})</span>
-</span><span id="L-415"><a href="#L-415"><span class="linenos">415</span></a>
-</span><span id="L-416"><a href="#L-416"><span class="linenos">416</span></a>    <span class="k">for</span> <span class="n">key</span><span class="p">,</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="L-417"><a href="#L-417"><span class="linenos">417</span></a>        <span class="k">if</span> <span class="n">val</span> <span class="o">&gt;</span> <span class="n">args</span><span class="o">.</span><span class="n">rare_value_count_upper_bound</span><span class="p">:</span>
-</span><span id="L-418"><a href="#L-418"><span class="linenos">418</span></a>            <span class="n">IGNORED_VALUES</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">key</span><span class="p">)</span>
+</span><span id="L-403"><a href="#L-403"><span class="linenos">403</span></a>    <span class="k">return</span> <span class="n">output_storage_cov</span>
+</span><span id="L-404"><a href="#L-404"><span class="linenos">404</span></a>
+</span><span id="L-405"><a href="#L-405"><span class="linenos">405</span></a>
+</span><span id="L-406"><a href="#L-406"><span class="linenos">406</span></a><span class="k">def</span> <span class="nf">compute_feature_memory_consumption</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
+</span><span id="L-407"><a href="#L-407"><span class="linenos">407</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;An approximation of how much feature take up&quot;&quot;&quot;</span>
+</span><span id="L-408"><a href="#L-408"><span class="linenos">408</span></a>    <span class="n">output_storage_features</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">set</span><span class="p">)</span>
+</span><span id="L-409"><a href="#L-409"><span class="linenos">409</span></a>    <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
+</span><span id="L-410"><a href="#L-410"><span class="linenos">410</span></a>        <span class="n">specific_column</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="L-411"><a href="#L-411"><span class="linenos">411</span></a>            <span class="nb">str</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">col</span><span class="p">]</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">str</span><span class="p">)</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="L-412"><a href="#L-412"><span class="linenos">412</span></a>        <span class="p">]</span>
+</span><span id="L-413"><a href="#L-413"><span class="linenos">413</span></a>        <span class="n">col_size</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">(</span>
+</span><span id="L-414"><a href="#L-414"><span class="linenos">414</span></a>            <span class="nb">len</span><span class="p">(</span><span class="n">x</span><span class="o">.</span><span class="n">encode</span><span class="p">())</span>
+</span><span id="L-415"><a href="#L-415"><span class="linenos">415</span></a>            <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">specific_column</span>
+</span><span id="L-416"><a href="#L-416"><span class="linenos">416</span></a>        <span class="p">)</span> <span class="o">/</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="L-417"><a href="#L-417"><span class="linenos">417</span></a>        <span class="n">output_storage_features</span><span class="p">[</span><span class="n">col</span><span class="p">]</span> <span class="o">=</span> <span class="n">col_size</span>
+</span><span id="L-418"><a href="#L-418"><span class="linenos">418</span></a>    <span class="k">return</span> <span class="n">output_storage_features</span>
 </span><span id="L-419"><a href="#L-419"><span class="linenos">419</span></a>
-</span><span id="L-420"><a href="#L-420"><span class="linenos">420</span></a>    <span class="k">for</span> <span class="n">to_remove_val</span> <span class="ow">in</span> <span class="n">IGNORED_VALUES</span><span class="p">:</span>
-</span><span id="L-421"><a href="#L-421"><span class="linenos">421</span></a>        <span class="k">del</span> <span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="p">[</span><span class="n">to_remove_val</span><span class="p">]</span>
-</span><span id="L-422"><a href="#L-422"><span class="linenos">422</span></a>
+</span><span id="L-420"><a href="#L-420"><span class="linenos">420</span></a>
+</span><span id="L-421"><a href="#L-421"><span class="linenos">421</span></a><span class="k">def</span> <span class="nf">compute_value_counts</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">):</span>
+</span><span id="L-422"><a href="#L-422"><span class="linenos">422</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Update the count structure&quot;&quot;&quot;</span>
 </span><span id="L-423"><a href="#L-423"><span class="linenos">423</span></a>
-</span><span id="L-424"><a href="#L-424"><span class="linenos">424</span></a><span class="k">def</span> <span class="nf">compute_cardinalities</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">max_unique_hist_constraint</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-425"><a href="#L-425"><span class="linenos">425</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute cardinalities of features, incrementally&quot;&quot;&quot;</span>
+</span><span id="L-424"><a href="#L-424"><span class="linenos">424</span></a>    <span class="k">global</span> <span class="n">GLOBAL_RARE_VALUE_STORAGE</span>
+</span><span id="L-425"><a href="#L-425"><span class="linenos">425</span></a>    <span class="k">global</span> <span class="n">IGNORED_VALUES</span>
 </span><span id="L-426"><a href="#L-426"><span class="linenos">426</span></a>
-</span><span id="L-427"><a href="#L-427"><span class="linenos">427</span></a>    <span class="k">global</span> <span class="n">GLOBAL_CARDINALITY_STORAGE</span>
-</span><span id="L-428"><a href="#L-428"><span class="linenos">428</span></a>    <span class="n">output_storage_card</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">set</span><span class="p">)</span>
-</span><span id="L-429"><a href="#L-429"><span class="linenos">429</span></a>    <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">column</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">):</span>
-</span><span id="L-430"><a href="#L-430"><span class="linenos">430</span></a>        <span class="n">output_storage_card</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">unique</span><span class="p">())</span>
-</span><span id="L-431"><a href="#L-431"><span class="linenos">431</span></a>        <span class="k">if</span> <span class="n">column</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="p">:</span>
-</span><span id="L-432"><a href="#L-432"><span class="linenos">432</span></a>            <span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="n">HyperLogLog</span><span class="p">(</span>
-</span><span id="L-433"><a href="#L-433"><span class="linenos">433</span></a>                <span class="n">HYPERLL_ERROR_BOUND</span><span class="p">,</span>
-</span><span id="L-434"><a href="#L-434"><span class="linenos">434</span></a>            <span class="p">)</span>
-</span><span id="L-435"><a href="#L-435"><span class="linenos">435</span></a>
-</span><span id="L-436"><a href="#L-436"><span class="linenos">436</span></a>        <span class="k">if</span> <span class="n">column</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">GLOBAL_COUNTS_STORAGE</span><span class="p">:</span>
-</span><span id="L-437"><a href="#L-437"><span class="linenos">437</span></a>            <span class="n">GLOBAL_COUNTS_STORAGE</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="n">PrimitiveConstrainedCounter</span><span class="p">(</span><span class="n">max_unique_hist_constraint</span><span class="p">)</span>
-</span><span id="L-438"><a href="#L-438"><span class="linenos">438</span></a>
-</span><span id="L-439"><a href="#L-439"><span class="linenos">439</span></a>        <span class="p">[</span><span class="n">GLOBAL_COUNTS_STORAGE</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">value</span><span class="p">)</span> <span class="k">for</span> <span class="n">value</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">]</span>
+</span><span id="L-427"><a href="#L-427"><span class="linenos">427</span></a>    <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
+</span><span id="L-428"><a href="#L-428"><span class="linenos">428</span></a>        <span class="n">main_values</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
+</span><span id="L-429"><a href="#L-429"><span class="linenos">429</span></a>        <span class="k">for</span> <span class="n">value</span> <span class="ow">in</span> <span class="n">main_values</span><span class="p">:</span>
+</span><span id="L-430"><a href="#L-430"><span class="linenos">430</span></a>            <span class="k">if</span> <span class="n">value</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">IGNORED_VALUES</span><span class="p">:</span>
+</span><span id="L-431"><a href="#L-431"><span class="linenos">431</span></a>                <span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="o">.</span><span class="n">update</span><span class="p">({(</span><span class="n">column</span><span class="p">,</span> <span class="n">value</span><span class="p">):</span> <span class="mi">1</span><span class="p">})</span>
+</span><span id="L-432"><a href="#L-432"><span class="linenos">432</span></a>
+</span><span id="L-433"><a href="#L-433"><span class="linenos">433</span></a>    <span class="k">for</span> <span class="n">key</span><span class="p">,</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-434"><a href="#L-434"><span class="linenos">434</span></a>        <span class="k">if</span> <span class="n">val</span> <span class="o">&gt;</span> <span class="n">args</span><span class="o">.</span><span class="n">rare_value_count_upper_bound</span><span class="p">:</span>
+</span><span id="L-435"><a href="#L-435"><span class="linenos">435</span></a>            <span class="n">IGNORED_VALUES</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">key</span><span class="p">)</span>
+</span><span id="L-436"><a href="#L-436"><span class="linenos">436</span></a>
+</span><span id="L-437"><a href="#L-437"><span class="linenos">437</span></a>    <span class="k">for</span> <span class="n">to_remove_val</span> <span class="ow">in</span> <span class="n">IGNORED_VALUES</span><span class="p">:</span>
+</span><span id="L-438"><a href="#L-438"><span class="linenos">438</span></a>        <span class="k">del</span> <span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="p">[</span><span class="n">to_remove_val</span><span class="p">]</span>
+</span><span id="L-439"><a href="#L-439"><span class="linenos">439</span></a>
 </span><span id="L-440"><a href="#L-440"><span class="linenos">440</span></a>
-</span><span id="L-441"><a href="#L-441"><span class="linenos">441</span></a>        <span class="k">for</span> <span class="n">unique_value</span> <span class="ow">in</span> <span class="nb">set</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">unique</span><span class="p">()):</span>
-</span><span id="L-442"><a href="#L-442"><span class="linenos">442</span></a>            <span class="k">if</span> <span class="n">unique_value</span><span class="p">:</span>
-</span><span id="L-443"><a href="#L-443"><span class="linenos">443</span></a>                <span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">add</span><span class="p">(</span>
-</span><span id="L-444"><a href="#L-444"><span class="linenos">444</span></a>                    <span class="n">internal_hash</span><span class="p">(</span><span class="n">unique_value</span><span class="p">),</span>
-</span><span id="L-445"><a href="#L-445"><span class="linenos">445</span></a>                <span class="p">)</span>
-</span><span id="L-446"><a href="#L-446"><span class="linenos">446</span></a>
-</span><span id="L-447"><a href="#L-447"><span class="linenos">447</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span>
-</span><span id="L-448"><a href="#L-448"><span class="linenos">448</span></a>            <span class="sa">f</span><span class="s1">&#39;Computing cardinality (Hyperloglog update) </span><span class="si">{</span><span class="n">enx</span><span class="si">}</span><span class="s1">/</span><span class="si">{</span><span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="L-449"><a href="#L-449"><span class="linenos">449</span></a>        <span class="p">)</span>
-</span><span id="L-450"><a href="#L-450"><span class="linenos">450</span></a>
-</span><span id="L-451"><a href="#L-451"><span class="linenos">451</span></a>
-</span><span id="L-452"><a href="#L-452"><span class="linenos">452</span></a><span class="k">def</span> <span class="nf">compute_bounds_increment</span><span class="p">(</span>
-</span><span id="L-453"><a href="#L-453"><span class="linenos">453</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">numeric_column_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
-</span><span id="L-454"><a href="#L-454"><span class="linenos">454</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]:</span>
-</span><span id="L-455"><a href="#L-455"><span class="linenos">455</span></a>    <span class="n">all_features</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span>
-</span><span id="L-456"><a href="#L-456"><span class="linenos">456</span></a>    <span class="n">numeric_column_types</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">numeric_column_types</span><span class="p">)</span>
-</span><span id="L-457"><a href="#L-457"><span class="linenos">457</span></a>    <span class="n">summary_object</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="L-458"><a href="#L-458"><span class="linenos">458</span></a>    <span class="n">summary_storage</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="L-459"><a href="#L-459"><span class="linenos">459</span></a>    <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">all_features</span><span class="p">:</span>
-</span><span id="L-460"><a href="#L-460"><span class="linenos">460</span></a>        <span class="k">if</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">numeric_column_types</span><span class="p">:</span>
-</span><span id="L-461"><a href="#L-461"><span class="linenos">461</span></a>            <span class="n">feature_vector</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">to_numeric</span><span class="p">(</span>
-</span><span id="L-462"><a href="#L-462"><span class="linenos">462</span></a>                <span class="n">input_dataframe</span><span class="p">[</span><span class="n">feature</span><span class="p">],</span> <span class="n">errors</span><span class="o">=</span><span class="s1">&#39;coerce&#39;</span><span class="p">,</span>
-</span><span id="L-463"><a href="#L-463"><span class="linenos">463</span></a>            <span class="p">)</span>
-</span><span id="L-464"><a href="#L-464"><span class="linenos">464</span></a>            <span class="n">minimum</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">)</span>
-</span><span id="L-465"><a href="#L-465"><span class="linenos">465</span></a>            <span class="n">maximum</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">)</span>
-</span><span id="L-466"><a href="#L-466"><span class="linenos">466</span></a>            <span class="n">mean</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">)</span>
-</span><span id="L-467"><a href="#L-467"><span class="linenos">467</span></a>            <span class="n">summary_storage</span> <span class="o">=</span> <span class="n">NumericFeatureSummary</span><span class="p">(</span>
-</span><span id="L-468"><a href="#L-468"><span class="linenos">468</span></a>                <span class="n">feature</span><span class="p">,</span> <span class="n">minimum</span><span class="p">,</span> <span class="n">maximum</span><span class="p">,</span> <span class="n">mean</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span>
-</span><span id="L-469"><a href="#L-469"><span class="linenos">469</span></a>                    <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">),</span>
-</span><span id="L-470"><a href="#L-470"><span class="linenos">470</span></a>                <span class="p">),</span>
-</span><span id="L-471"><a href="#L-471"><span class="linenos">471</span></a>            <span class="p">)</span>
-</span><span id="L-472"><a href="#L-472"><span class="linenos">472</span></a>            <span class="n">summary_object</span><span class="p">[</span><span class="n">feature</span><span class="p">]</span> <span class="o">=</span> <span class="n">summary_storage</span>
-</span><span id="L-473"><a href="#L-473"><span class="linenos">473</span></a>
-</span><span id="L-474"><a href="#L-474"><span class="linenos">474</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-475"><a href="#L-475"><span class="linenos">475</span></a>            <span class="n">feature_vector</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">feature</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
-</span><span id="L-476"><a href="#L-476"><span class="linenos">476</span></a>            <span class="n">summary_storage</span> <span class="o">=</span> <span class="n">NominalFeatureSummary</span><span class="p">(</span>
-</span><span id="L-477"><a href="#L-477"><span class="linenos">477</span></a>                <span class="n">feature</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">)),</span>
-</span><span id="L-478"><a href="#L-478"><span class="linenos">478</span></a>            <span class="p">)</span>
-</span><span id="L-479"><a href="#L-479"><span class="linenos">479</span></a>            <span class="n">summary_object</span><span class="p">[</span><span class="n">feature</span><span class="p">]</span> <span class="o">=</span> <span class="n">summary_storage</span>
-</span><span id="L-480"><a href="#L-480"><span class="linenos">480</span></a>
-</span><span id="L-481"><a href="#L-481"><span class="linenos">481</span></a>    <span class="k">return</span> <span class="n">summary_object</span>
-</span><span id="L-482"><a href="#L-482"><span class="linenos">482</span></a>
-</span><span id="L-483"><a href="#L-483"><span class="linenos">483</span></a>
-</span><span id="L-484"><a href="#L-484"><span class="linenos">484</span></a><span class="k">def</span> <span class="nf">compute_batch_ranking</span><span class="p">(</span>
-</span><span id="L-485"><a href="#L-485"><span class="linenos">485</span></a>    <span class="n">line_tmp_storage</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span>
-</span><span id="L-486"><a href="#L-486"><span class="linenos">486</span></a>    <span class="n">numeric_column_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
-</span><span id="L-487"><a href="#L-487"><span class="linenos">487</span></a>    <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="L-488"><a href="#L-488"><span class="linenos">488</span></a>    <span class="n">cpu_pool</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="L-489"><a href="#L-489"><span class="linenos">489</span></a>    <span class="n">column_descriptions</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
-</span><span id="L-490"><a href="#L-490"><span class="linenos">490</span></a>    <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="L-491"><a href="#L-491"><span class="linenos">491</span></a>    <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="L-492"><a href="#L-492"><span class="linenos">492</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">BatchRankingSummary</span><span class="p">,</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]]:</span>
-</span><span id="L-493"><a href="#L-493"><span class="linenos">493</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Enrich the feature space and compute the batch importances&quot;&quot;&quot;</span>
-</span><span id="L-494"><a href="#L-494"><span class="linenos">494</span></a>
-</span><span id="L-495"><a href="#L-495"><span class="linenos">495</span></a>    <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">line_tmp_storage</span><span class="p">)</span>
-</span><span id="L-496"><a href="#L-496"><span class="linenos">496</span></a>    <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="n">column_descriptions</span>
-</span><span id="L-497"><a href="#L-497"><span class="linenos">497</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Control features&#39;</span><span class="p">)</span>
-</span><span id="L-498"><a href="#L-498"><span class="linenos">498</span></a>
-</span><span id="L-499"><a href="#L-499"><span class="linenos">499</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">feature_set_focus</span><span class="p">:</span>
-</span><span id="L-500"><a href="#L-500"><span class="linenos">500</span></a>        <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">feature_set_focus</span> <span class="o">==</span> <span class="s1">&#39;_all_from_reference_JSON&#39;</span><span class="p">:</span>
-</span><span id="L-501"><a href="#L-501"><span class="linenos">501</span></a>            <span class="n">focus_set</span> <span class="o">=</span> <span class="n">extract_features_from_reference_JSON</span><span class="p">(</span>
-</span><span id="L-502"><a href="#L-502"><span class="linenos">502</span></a>                <span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span><span class="p">,</span>
-</span><span id="L-503"><a href="#L-503"><span class="linenos">503</span></a>            <span class="p">)</span>
-</span><span id="L-504"><a href="#L-504"><span class="linenos">504</span></a>
-</span><span id="L-505"><a href="#L-505"><span class="linenos">505</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-506"><a href="#L-506"><span class="linenos">506</span></a>            <span class="n">focus_set</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">feature_set_focus</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))</span>
-</span><span id="L-507"><a href="#L-507"><span class="linenos">507</span></a>
-</span><span id="L-508"><a href="#L-508"><span class="linenos">508</span></a>        <span class="n">focus_set</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">label_column</span><span class="p">)</span>
-</span><span id="L-509"><a href="#L-509"><span class="linenos">509</span></a>        <span class="n">focus_set</span> <span class="o">=</span> <span class="p">{</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">focus_set</span> <span class="k">if</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span><span class="p">}</span>
-</span><span id="L-510"><a href="#L-510"><span class="linenos">510</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="nb">list</span><span class="p">(</span><span class="n">focus_set</span><span class="p">)]</span>
+</span><span id="L-441"><a href="#L-441"><span class="linenos">441</span></a><span class="k">def</span> <span class="nf">compute_cardinalities</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">max_unique_hist_constraint</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-442"><a href="#L-442"><span class="linenos">442</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute cardinalities of features, incrementally&quot;&quot;&quot;</span>
+</span><span id="L-443"><a href="#L-443"><span class="linenos">443</span></a>
+</span><span id="L-444"><a href="#L-444"><span class="linenos">444</span></a>    <span class="k">global</span> <span class="n">GLOBAL_CARDINALITY_STORAGE</span>
+</span><span id="L-445"><a href="#L-445"><span class="linenos">445</span></a>    <span class="n">output_storage_card</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">set</span><span class="p">)</span>
+</span><span id="L-446"><a href="#L-446"><span class="linenos">446</span></a>    <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">column</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">):</span>
+</span><span id="L-447"><a href="#L-447"><span class="linenos">447</span></a>        <span class="n">output_storage_card</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">unique</span><span class="p">())</span>
+</span><span id="L-448"><a href="#L-448"><span class="linenos">448</span></a>        <span class="k">if</span> <span class="n">column</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="p">:</span>
+</span><span id="L-449"><a href="#L-449"><span class="linenos">449</span></a>            <span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="n">HyperLogLog</span><span class="p">(</span>
+</span><span id="L-450"><a href="#L-450"><span class="linenos">450</span></a>                <span class="n">HYPERLL_ERROR_BOUND</span><span class="p">,</span>
+</span><span id="L-451"><a href="#L-451"><span class="linenos">451</span></a>            <span class="p">)</span>
+</span><span id="L-452"><a href="#L-452"><span class="linenos">452</span></a>
+</span><span id="L-453"><a href="#L-453"><span class="linenos">453</span></a>        <span class="k">if</span> <span class="n">column</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">GLOBAL_COUNTS_STORAGE</span><span class="p">:</span>
+</span><span id="L-454"><a href="#L-454"><span class="linenos">454</span></a>            <span class="n">GLOBAL_COUNTS_STORAGE</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="n">PrimitiveConstrainedCounter</span><span class="p">(</span><span class="n">max_unique_hist_constraint</span><span class="p">)</span>
+</span><span id="L-455"><a href="#L-455"><span class="linenos">455</span></a>
+</span><span id="L-456"><a href="#L-456"><span class="linenos">456</span></a>        <span class="p">[</span><span class="n">GLOBAL_COUNTS_STORAGE</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">value</span><span class="p">)</span> <span class="k">for</span> <span class="n">value</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">]</span>
+</span><span id="L-457"><a href="#L-457"><span class="linenos">457</span></a>
+</span><span id="L-458"><a href="#L-458"><span class="linenos">458</span></a>        <span class="k">for</span> <span class="n">unique_value</span> <span class="ow">in</span> <span class="nb">set</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">unique</span><span class="p">()):</span>
+</span><span id="L-459"><a href="#L-459"><span class="linenos">459</span></a>            <span class="k">if</span> <span class="n">unique_value</span><span class="p">:</span>
+</span><span id="L-460"><a href="#L-460"><span class="linenos">460</span></a>                <span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">add</span><span class="p">(</span>
+</span><span id="L-461"><a href="#L-461"><span class="linenos">461</span></a>                    <span class="n">internal_hash</span><span class="p">(</span><span class="n">unique_value</span><span class="p">),</span>
+</span><span id="L-462"><a href="#L-462"><span class="linenos">462</span></a>                <span class="p">)</span>
+</span><span id="L-463"><a href="#L-463"><span class="linenos">463</span></a>
+</span><span id="L-464"><a href="#L-464"><span class="linenos">464</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span>
+</span><span id="L-465"><a href="#L-465"><span class="linenos">465</span></a>            <span class="sa">f</span><span class="s1">&#39;Computing cardinality (Hyperloglog update) </span><span class="si">{</span><span class="n">enx</span><span class="si">}</span><span class="s1">/</span><span class="si">{</span><span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="L-466"><a href="#L-466"><span class="linenos">466</span></a>        <span class="p">)</span>
+</span><span id="L-467"><a href="#L-467"><span class="linenos">467</span></a>
+</span><span id="L-468"><a href="#L-468"><span class="linenos">468</span></a>
+</span><span id="L-469"><a href="#L-469"><span class="linenos">469</span></a><span class="k">def</span> <span class="nf">compute_bounds_increment</span><span class="p">(</span>
+</span><span id="L-470"><a href="#L-470"><span class="linenos">470</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">numeric_column_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
+</span><span id="L-471"><a href="#L-471"><span class="linenos">471</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]:</span>
+</span><span id="L-472"><a href="#L-472"><span class="linenos">472</span></a>    <span class="n">all_features</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span>
+</span><span id="L-473"><a href="#L-473"><span class="linenos">473</span></a>    <span class="n">numeric_column_types</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">numeric_column_types</span><span class="p">)</span>
+</span><span id="L-474"><a href="#L-474"><span class="linenos">474</span></a>    <span class="n">summary_object</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-475"><a href="#L-475"><span class="linenos">475</span></a>    <span class="n">summary_storage</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-476"><a href="#L-476"><span class="linenos">476</span></a>    <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">all_features</span><span class="p">:</span>
+</span><span id="L-477"><a href="#L-477"><span class="linenos">477</span></a>        <span class="k">if</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">numeric_column_types</span><span class="p">:</span>
+</span><span id="L-478"><a href="#L-478"><span class="linenos">478</span></a>            <span class="n">feature_vector</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">to_numeric</span><span class="p">(</span>
+</span><span id="L-479"><a href="#L-479"><span class="linenos">479</span></a>                <span class="n">input_dataframe</span><span class="p">[</span><span class="n">feature</span><span class="p">],</span> <span class="n">errors</span><span class="o">=</span><span class="s1">&#39;coerce&#39;</span><span class="p">,</span>
+</span><span id="L-480"><a href="#L-480"><span class="linenos">480</span></a>            <span class="p">)</span>
+</span><span id="L-481"><a href="#L-481"><span class="linenos">481</span></a>            <span class="n">minimum</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">)</span>
+</span><span id="L-482"><a href="#L-482"><span class="linenos">482</span></a>            <span class="n">maximum</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">)</span>
+</span><span id="L-483"><a href="#L-483"><span class="linenos">483</span></a>            <span class="n">mean</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">)</span>
+</span><span id="L-484"><a href="#L-484"><span class="linenos">484</span></a>            <span class="n">summary_storage</span> <span class="o">=</span> <span class="n">NumericFeatureSummary</span><span class="p">(</span>
+</span><span id="L-485"><a href="#L-485"><span class="linenos">485</span></a>                <span class="n">feature</span><span class="p">,</span> <span class="n">minimum</span><span class="p">,</span> <span class="n">maximum</span><span class="p">,</span> <span class="n">mean</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span>
+</span><span id="L-486"><a href="#L-486"><span class="linenos">486</span></a>                    <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">),</span>
+</span><span id="L-487"><a href="#L-487"><span class="linenos">487</span></a>                <span class="p">),</span>
+</span><span id="L-488"><a href="#L-488"><span class="linenos">488</span></a>            <span class="p">)</span>
+</span><span id="L-489"><a href="#L-489"><span class="linenos">489</span></a>            <span class="n">summary_object</span><span class="p">[</span><span class="n">feature</span><span class="p">]</span> <span class="o">=</span> <span class="n">summary_storage</span>
+</span><span id="L-490"><a href="#L-490"><span class="linenos">490</span></a>
+</span><span id="L-491"><a href="#L-491"><span class="linenos">491</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-492"><a href="#L-492"><span class="linenos">492</span></a>            <span class="n">feature_vector</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">feature</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
+</span><span id="L-493"><a href="#L-493"><span class="linenos">493</span></a>            <span class="n">summary_storage</span> <span class="o">=</span> <span class="n">NominalFeatureSummary</span><span class="p">(</span>
+</span><span id="L-494"><a href="#L-494"><span class="linenos">494</span></a>                <span class="n">feature</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">)),</span>
+</span><span id="L-495"><a href="#L-495"><span class="linenos">495</span></a>            <span class="p">)</span>
+</span><span id="L-496"><a href="#L-496"><span class="linenos">496</span></a>            <span class="n">summary_object</span><span class="p">[</span><span class="n">feature</span><span class="p">]</span> <span class="o">=</span> <span class="n">summary_storage</span>
+</span><span id="L-497"><a href="#L-497"><span class="linenos">497</span></a>
+</span><span id="L-498"><a href="#L-498"><span class="linenos">498</span></a>    <span class="k">return</span> <span class="n">summary_object</span>
+</span><span id="L-499"><a href="#L-499"><span class="linenos">499</span></a>
+</span><span id="L-500"><a href="#L-500"><span class="linenos">500</span></a>
+</span><span id="L-501"><a href="#L-501"><span class="linenos">501</span></a><span class="k">def</span> <span class="nf">compute_batch_ranking</span><span class="p">(</span>
+</span><span id="L-502"><a href="#L-502"><span class="linenos">502</span></a>    <span class="n">line_tmp_storage</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span>
+</span><span id="L-503"><a href="#L-503"><span class="linenos">503</span></a>    <span class="n">numeric_column_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
+</span><span id="L-504"><a href="#L-504"><span class="linenos">504</span></a>    <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="L-505"><a href="#L-505"><span class="linenos">505</span></a>    <span class="n">cpu_pool</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="L-506"><a href="#L-506"><span class="linenos">506</span></a>    <span class="n">column_descriptions</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
+</span><span id="L-507"><a href="#L-507"><span class="linenos">507</span></a>    <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="L-508"><a href="#L-508"><span class="linenos">508</span></a>    <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="L-509"><a href="#L-509"><span class="linenos">509</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">BatchRankingSummary</span><span class="p">,</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]]:</span>
+</span><span id="L-510"><a href="#L-510"><span class="linenos">510</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Enrich the feature space and compute the batch importances&quot;&quot;&quot;</span>
 </span><span id="L-511"><a href="#L-511"><span class="linenos">511</span></a>
-</span><span id="L-512"><a href="#L-512"><span class="linenos">512</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">transformers</span> <span class="o">!=</span> <span class="s1">&#39;none&#39;</span><span class="p">:</span>
-</span><span id="L-513"><a href="#L-513"><span class="linenos">513</span></a>
-</span><span id="L-514"><a href="#L-514"><span class="linenos">514</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Adding transformations&#39;</span><span class="p">)</span>
-</span><span id="L-515"><a href="#L-515"><span class="linenos">515</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">enrich_with_transformations</span><span class="p">(</span>
-</span><span id="L-516"><a href="#L-516"><span class="linenos">516</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">numeric_column_types</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span>
-</span><span id="L-517"><a href="#L-517"><span class="linenos">517</span></a>        <span class="p">)</span>
-</span><span id="L-518"><a href="#L-518"><span class="linenos">518</span></a>
-</span><span id="L-519"><a href="#L-519"><span class="linenos">519</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">explode_multivalue_features</span> <span class="o">!=</span> <span class="s1">&#39;False&#39;</span><span class="p">:</span>
-</span><span id="L-520"><a href="#L-520"><span class="linenos">520</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Constructing new features from multivalue ones&#39;</span><span class="p">)</span>
-</span><span id="L-521"><a href="#L-521"><span class="linenos">521</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">compute_expanded_multivalue_features</span><span class="p">(</span>
-</span><span id="L-522"><a href="#L-522"><span class="linenos">522</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span>
-</span><span id="L-523"><a href="#L-523"><span class="linenos">523</span></a>        <span class="p">)</span>
+</span><span id="L-512"><a href="#L-512"><span class="linenos">512</span></a>    <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">line_tmp_storage</span><span class="p">)</span>
+</span><span id="L-513"><a href="#L-513"><span class="linenos">513</span></a>    <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="n">column_descriptions</span>
+</span><span id="L-514"><a href="#L-514"><span class="linenos">514</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Control features&#39;</span><span class="p">)</span>
+</span><span id="L-515"><a href="#L-515"><span class="linenos">515</span></a>
+</span><span id="L-516"><a href="#L-516"><span class="linenos">516</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">feature_set_focus</span><span class="p">:</span>
+</span><span id="L-517"><a href="#L-517"><span class="linenos">517</span></a>        <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">feature_set_focus</span> <span class="o">==</span> <span class="s1">&#39;_all_from_reference_JSON&#39;</span><span class="p">:</span>
+</span><span id="L-518"><a href="#L-518"><span class="linenos">518</span></a>            <span class="n">focus_set</span> <span class="o">=</span> <span class="n">extract_features_from_reference_JSON</span><span class="p">(</span>
+</span><span id="L-519"><a href="#L-519"><span class="linenos">519</span></a>                <span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span><span class="p">,</span>
+</span><span id="L-520"><a href="#L-520"><span class="linenos">520</span></a>            <span class="p">)</span>
+</span><span id="L-521"><a href="#L-521"><span class="linenos">521</span></a>
+</span><span id="L-522"><a href="#L-522"><span class="linenos">522</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-523"><a href="#L-523"><span class="linenos">523</span></a>            <span class="n">focus_set</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">feature_set_focus</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))</span>
 </span><span id="L-524"><a href="#L-524"><span class="linenos">524</span></a>
-</span><span id="L-525"><a href="#L-525"><span class="linenos">525</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">subfeature_mapping</span> <span class="o">!=</span> <span class="s1">&#39;False&#39;</span><span class="p">:</span>
-</span><span id="L-526"><a href="#L-526"><span class="linenos">526</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Constructing new (sub)features&#39;</span><span class="p">)</span>
-</span><span id="L-527"><a href="#L-527"><span class="linenos">527</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">compute_subfeatures</span><span class="p">(</span>
-</span><span id="L-528"><a href="#L-528"><span class="linenos">528</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span>
-</span><span id="L-529"><a href="#L-529"><span class="linenos">529</span></a>        <span class="p">)</span>
+</span><span id="L-525"><a href="#L-525"><span class="linenos">525</span></a>        <span class="n">focus_set</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">label_column</span><span class="p">)</span>
+</span><span id="L-526"><a href="#L-526"><span class="linenos">526</span></a>        <span class="n">focus_set</span> <span class="o">=</span> <span class="p">{</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">focus_set</span> <span class="k">if</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span><span class="p">}</span>
+</span><span id="L-527"><a href="#L-527"><span class="linenos">527</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="nb">list</span><span class="p">(</span><span class="n">focus_set</span><span class="p">)]</span>
+</span><span id="L-528"><a href="#L-528"><span class="linenos">528</span></a>
+</span><span id="L-529"><a href="#L-529"><span class="linenos">529</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">transformers</span> <span class="o">!=</span> <span class="s1">&#39;none&#39;</span><span class="p">:</span>
 </span><span id="L-530"><a href="#L-530"><span class="linenos">530</span></a>
-</span><span id="L-531"><a href="#L-531"><span class="linenos">531</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span> <span class="o">&gt;</span> <span class="mi">1</span> <span class="ow">or</span> <span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span><span class="p">:</span>
-</span><span id="L-532"><a href="#L-532"><span class="linenos">532</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Constructing new features&#39;</span><span class="p">)</span>
-</span><span id="L-533"><a href="#L-533"><span class="linenos">533</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">compute_combined_features</span><span class="p">(</span>
-</span><span id="L-534"><a href="#L-534"><span class="linenos">534</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span>
-</span><span id="L-535"><a href="#L-535"><span class="linenos">535</span></a>        <span class="p">)</span>
-</span><span id="L-536"><a href="#L-536"><span class="linenos">536</span></a>
-</span><span id="L-537"><a href="#L-537"><span class="linenos">537</span></a>    <span class="c1"># in case of 3mr we compute the score of combinations against the target</span>
-</span><span id="L-538"><a href="#L-538"><span class="linenos">538</span></a>    <span class="k">if</span> <span class="s1">&#39;3mr&#39;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">:</span>
-</span><span id="L-539"><a href="#L-539"><span class="linenos">539</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span>
-</span><span id="L-540"><a href="#L-540"><span class="linenos">540</span></a>            <span class="s1">&#39;Constructing features for computing relations in 3mr&#39;</span><span class="p">,</span>
-</span><span id="L-541"><a href="#L-541"><span class="linenos">541</span></a>        <span class="p">)</span>
-</span><span id="L-542"><a href="#L-542"><span class="linenos">542</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">compute_combined_features</span><span class="p">(</span>
-</span><span id="L-543"><a href="#L-543"><span class="linenos">543</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="L-544"><a href="#L-544"><span class="linenos">544</span></a>        <span class="p">)</span>
-</span><span id="L-545"><a href="#L-545"><span class="linenos">545</span></a>
-</span><span id="L-546"><a href="#L-546"><span class="linenos">546</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">include_noise_baseline_features</span> <span class="o">==</span> <span class="s1">&#39;True&#39;</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">!=</span> <span class="s1">&#39;Constant&#39;</span><span class="p">:</span>
-</span><span id="L-547"><a href="#L-547"><span class="linenos">547</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Computing baseline features&#39;</span><span class="p">)</span>
-</span><span id="L-548"><a href="#L-548"><span class="linenos">548</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">include_noisy_features</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="L-549"><a href="#L-549"><span class="linenos">549</span></a>
-</span><span id="L-550"><a href="#L-550"><span class="linenos">550</span></a>    <span class="c1"># Compute incremental statistic useful for data inspection/transformer generation</span>
-</span><span id="L-551"><a href="#L-551"><span class="linenos">551</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Computing coverage&#39;</span><span class="p">)</span>
-</span><span id="L-552"><a href="#L-552"><span class="linenos">552</span></a>    <span class="n">coverage_storage</span> <span class="o">=</span> <span class="n">compute_coverage</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="L-553"><a href="#L-553"><span class="linenos">553</span></a>    <span class="n">feature_memory_consumption</span> <span class="o">=</span> <span class="n">compute_feature_memory_consumption</span><span class="p">(</span>
-</span><span id="L-554"><a href="#L-554"><span class="linenos">554</span></a>        <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span>
-</span><span id="L-555"><a href="#L-555"><span class="linenos">555</span></a>    <span class="p">)</span>
-</span><span id="L-556"><a href="#L-556"><span class="linenos">556</span></a>    <span class="n">compute_cardinalities</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">max_unique_hist_constraint</span><span class="p">)</span>
-</span><span id="L-557"><a href="#L-557"><span class="linenos">557</span></a>
-</span><span id="L-558"><a href="#L-558"><span class="linenos">558</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">task</span> <span class="o">==</span> <span class="s1">&#39;identify_rare_values&#39;</span><span class="p">:</span>
-</span><span id="L-559"><a href="#L-559"><span class="linenos">559</span></a>        <span class="n">compute_value_counts</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="L-560"><a href="#L-560"><span class="linenos">560</span></a>
-</span><span id="L-561"><a href="#L-561"><span class="linenos">561</span></a>    <span class="n">bounds_storage</span> <span class="o">=</span> <span class="n">compute_bounds_increment</span><span class="p">(</span>
-</span><span id="L-562"><a href="#L-562"><span class="linenos">562</span></a>        <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">numeric_column_types</span><span class="p">,</span>
-</span><span id="L-563"><a href="#L-563"><span class="linenos">563</span></a>    <span class="p">)</span>
-</span><span id="L-564"><a href="#L-564"><span class="linenos">564</span></a>
-</span><span id="L-565"><a href="#L-565"><span class="linenos">565</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span>
-</span><span id="L-566"><a href="#L-566"><span class="linenos">566</span></a>        <span class="sa">f</span><span class="s1">&#39;Computing ranks for </span><span class="si">{</span><span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s1"> features&#39;</span><span class="p">,</span>
-</span><span id="L-567"><a href="#L-567"><span class="linenos">567</span></a>    <span class="p">)</span>
-</span><span id="L-568"><a href="#L-568"><span class="linenos">568</span></a>
-</span><span id="L-569"><a href="#L-569"><span class="linenos">569</span></a>    <span class="k">return</span> <span class="p">(</span>
-</span><span id="L-570"><a href="#L-570"><span class="linenos">570</span></a>        <span class="n">mixed_rank_graph</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">cpu_pool</span><span class="p">,</span> <span class="n">pbar</span><span class="p">),</span>
-</span><span id="L-571"><a href="#L-571"><span class="linenos">571</span></a>        <span class="n">bounds_storage</span><span class="p">,</span>
-</span><span id="L-572"><a href="#L-572"><span class="linenos">572</span></a>        <span class="n">coverage_storage</span><span class="p">,</span>
-</span><span id="L-573"><a href="#L-573"><span class="linenos">573</span></a>        <span class="n">feature_memory_consumption</span><span class="p">,</span>
-</span><span id="L-574"><a href="#L-574"><span class="linenos">574</span></a>    <span class="p">)</span>
-</span><span id="L-575"><a href="#L-575"><span class="linenos">575</span></a>
-</span><span id="L-576"><a href="#L-576"><span class="linenos">576</span></a>
-</span><span id="L-577"><a href="#L-577"><span class="linenos">577</span></a><span class="k">def</span> <span class="nf">get_num_of_instances</span><span class="p">(</span><span class="n">fname</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
-</span><span id="L-578"><a href="#L-578"><span class="linenos">578</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Count the number of lines in a file, fast - useful for progress logging&quot;&quot;&quot;</span>
-</span><span id="L-579"><a href="#L-579"><span class="linenos">579</span></a>
-</span><span id="L-580"><a href="#L-580"><span class="linenos">580</span></a>    <span class="k">def</span> <span class="nf">_make_gen</span><span class="p">(</span><span class="n">reader</span><span class="p">):</span>
-</span><span id="L-581"><a href="#L-581"><span class="linenos">581</span></a>        <span class="k">while</span> <span class="kc">True</span><span class="p">:</span>
-</span><span id="L-582"><a href="#L-582"><span class="linenos">582</span></a>            <span class="n">b</span> <span class="o">=</span> <span class="n">reader</span><span class="p">(</span><span class="mi">2</span><span class="o">**</span><span class="mi">16</span><span class="p">)</span>
-</span><span id="L-583"><a href="#L-583"><span class="linenos">583</span></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">b</span><span class="p">:</span>
-</span><span id="L-584"><a href="#L-584"><span class="linenos">584</span></a>                <span class="k">break</span>
-</span><span id="L-585"><a href="#L-585"><span class="linenos">585</span></a>            <span class="k">yield</span> <span class="n">b</span>
-</span><span id="L-586"><a href="#L-586"><span class="linenos">586</span></a>
-</span><span id="L-587"><a href="#L-587"><span class="linenos">587</span></a>    <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">fname</span><span class="p">,</span> <span class="s1">&#39;rb&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
-</span><span id="L-588"><a href="#L-588"><span class="linenos">588</span></a>        <span class="n">count</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">(</span><span class="n">buf</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="sa">b</span><span class="s1">&#39;</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">)</span> <span class="k">for</span> <span class="n">buf</span> <span class="ow">in</span> <span class="n">_make_gen</span><span class="p">(</span><span class="n">f</span><span class="o">.</span><span class="n">raw</span><span class="o">.</span><span class="n">read</span><span class="p">))</span>
-</span><span id="L-589"><a href="#L-589"><span class="linenos">589</span></a>    <span class="k">return</span> <span class="n">count</span>
-</span><span id="L-590"><a href="#L-590"><span class="linenos">590</span></a>
-</span><span id="L-591"><a href="#L-591"><span class="linenos">591</span></a>
-</span><span id="L-592"><a href="#L-592"><span class="linenos">592</span></a><span class="k">def</span> <span class="nf">get_grouped_df</span><span class="p">(</span><span class="n">importances_df_list</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">]])</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="L-593"><a href="#L-593"><span class="linenos">593</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;A helper method that enables median-based aggregation after processing&quot;&quot;&quot;</span>
-</span><span id="L-594"><a href="#L-594"><span class="linenos">594</span></a>
-</span><span id="L-595"><a href="#L-595"><span class="linenos">595</span></a>    <span class="n">importances_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">importances_df_list</span><span class="p">)</span>
-</span><span id="L-596"><a href="#L-596"><span class="linenos">596</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">importances_df</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="L-597"><a href="#L-597"><span class="linenos">597</span></a>        <span class="k">return</span> <span class="kc">None</span>
-</span><span id="L-598"><a href="#L-598"><span class="linenos">598</span></a>    <span class="n">importances_df</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;FeatureA&#39;</span><span class="p">,</span> <span class="s1">&#39;FeatureB&#39;</span><span class="p">,</span> <span class="s1">&#39;Score&#39;</span><span class="p">]</span>
-</span><span id="L-599"><a href="#L-599"><span class="linenos">599</span></a>    <span class="n">grouped</span> <span class="o">=</span> <span class="n">importances_df</span><span class="o">.</span><span class="n">groupby</span><span class="p">(</span>
-</span><span id="L-600"><a href="#L-600"><span class="linenos">600</span></a>        <span class="p">[</span><span class="s1">&#39;FeatureA&#39;</span><span class="p">,</span> <span class="s1">&#39;FeatureB&#39;</span><span class="p">],</span>
-</span><span id="L-601"><a href="#L-601"><span class="linenos">601</span></a>    <span class="p">)</span><span class="o">.</span><span class="n">median</span><span class="p">()</span><span class="o">.</span><span class="n">reset_index</span><span class="p">()</span>
-</span><span id="L-602"><a href="#L-602"><span class="linenos">602</span></a>    <span class="k">return</span> <span class="n">grouped</span>
-</span><span id="L-603"><a href="#L-603"><span class="linenos">603</span></a>
-</span><span id="L-604"><a href="#L-604"><span class="linenos">604</span></a>
-</span><span id="L-605"><a href="#L-605"><span class="linenos">605</span></a><span class="k">def</span> <span class="nf">checkpoint_importances_df</span><span class="p">(</span><span class="n">importances_batch</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">]])</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-606"><a href="#L-606"><span class="linenos">606</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;A helper which stores intermediary state - useful for longer runs&quot;&quot;&quot;</span>
-</span><span id="L-607"><a href="#L-607"><span class="linenos">607</span></a>
-</span><span id="L-608"><a href="#L-608"><span class="linenos">608</span></a>    <span class="n">gdf</span> <span class="o">=</span> <span class="n">get_grouped_df</span><span class="p">(</span><span class="n">importances_batch</span><span class="p">)</span>
-</span><span id="L-609"><a href="#L-609"><span class="linenos">609</span></a>    <span class="k">if</span> <span class="n">gdf</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-610"><a href="#L-610"><span class="linenos">610</span></a>        <span class="n">gdf</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span><span class="s1">&#39;ranking_checkpoint_tmp.tsv&#39;</span><span class="p">,</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="L-611"><a href="#L-611"><span class="linenos">611</span></a>
-</span><span id="L-612"><a href="#L-612"><span class="linenos">612</span></a>
-</span><span id="L-613"><a href="#L-613"><span class="linenos">613</span></a><span class="k">def</span> <span class="nf">estimate_importances_minibatches</span><span class="p">(</span>
-</span><span id="L-614"><a href="#L-614"><span class="linenos">614</span></a>    <span class="n">input_file</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="L-615"><a href="#L-615"><span class="linenos">615</span></a>    <span class="n">column_descriptions</span><span class="p">:</span> <span class="nb">list</span><span class="p">,</span>
-</span><span id="L-616"><a href="#L-616"><span class="linenos">616</span></a>    <span class="n">fw_col_mapping</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span>
-</span><span id="L-617"><a href="#L-617"><span class="linenos">617</span></a>    <span class="n">numeric_column_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">,</span>
-</span><span id="L-618"><a href="#L-618"><span class="linenos">618</span></a>    <span class="n">batch_size</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">100000</span><span class="p">,</span>
-</span><span id="L-619"><a href="#L-619"><span class="linenos">619</span></a>    <span class="n">args</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="L-620"><a href="#L-620"><span class="linenos">620</span></a>    <span class="n">data_encoding</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;utf-8&#39;</span><span class="p">,</span>
-</span><span id="L-621"><a href="#L-621"><span class="linenos">621</span></a>    <span class="n">cpu_pool</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="L-622"><a href="#L-622"><span class="linenos">622</span></a>    <span class="n">delimiter</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="L-623"><a href="#L-623"><span class="linenos">623</span></a>    <span class="n">feature_construction_mode</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="L-624"><a href="#L-624"><span class="linenos">624</span></a>    <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="L-625"><a href="#L-625"><span class="linenos">625</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]],</span> <span class="n">Any</span><span class="p">,</span> <span class="nb">dict</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="nb">list</span><span class="p">[</span><span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]],</span> <span class="nb">list</span><span class="p">[</span><span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]],</span> <span class="n">defaultdict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]]:</span>
-</span><span id="L-626"><a href="#L-626"><span class="linenos">626</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Interaction score estimator - suitable for example for csv-like input data types.</span>
-</span><span id="L-627"><a href="#L-627"><span class="linenos">627</span></a><span class="sd">    This type of data is normally a single large csv, meaning that minibatch processing needs to</span>
-</span><span id="L-628"><a href="#L-628"><span class="linenos">628</span></a><span class="sd">    happen during incremental handling of the file (that&quot;s not the case for pre-separated ob data)</span>
-</span><span id="L-629"><a href="#L-629"><span class="linenos">629</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="L-630"><a href="#L-630"><span class="linenos">630</span></a>
-</span><span id="L-631"><a href="#L-631"><span class="linenos">631</span></a>    <span class="n">invalid_line_queue</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="n">deque</span><span class="p">([],</span> <span class="n">maxlen</span><span class="o">=</span><span class="mi">2</span><span class="o">**</span><span class="mi">5</span><span class="p">)</span>
+</span><span id="L-531"><a href="#L-531"><span class="linenos">531</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Adding transformations&#39;</span><span class="p">)</span>
+</span><span id="L-532"><a href="#L-532"><span class="linenos">532</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">enrich_with_transformations</span><span class="p">(</span>
+</span><span id="L-533"><a href="#L-533"><span class="linenos">533</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">numeric_column_types</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span>
+</span><span id="L-534"><a href="#L-534"><span class="linenos">534</span></a>        <span class="p">)</span>
+</span><span id="L-535"><a href="#L-535"><span class="linenos">535</span></a>
+</span><span id="L-536"><a href="#L-536"><span class="linenos">536</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">explode_multivalue_features</span> <span class="o">!=</span> <span class="s1">&#39;False&#39;</span><span class="p">:</span>
+</span><span id="L-537"><a href="#L-537"><span class="linenos">537</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Constructing new features from multivalue ones&#39;</span><span class="p">)</span>
+</span><span id="L-538"><a href="#L-538"><span class="linenos">538</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">compute_expanded_multivalue_features</span><span class="p">(</span>
+</span><span id="L-539"><a href="#L-539"><span class="linenos">539</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span>
+</span><span id="L-540"><a href="#L-540"><span class="linenos">540</span></a>        <span class="p">)</span>
+</span><span id="L-541"><a href="#L-541"><span class="linenos">541</span></a>
+</span><span id="L-542"><a href="#L-542"><span class="linenos">542</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">subfeature_mapping</span> <span class="o">!=</span> <span class="s1">&#39;False&#39;</span><span class="p">:</span>
+</span><span id="L-543"><a href="#L-543"><span class="linenos">543</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Constructing new (sub)features&#39;</span><span class="p">)</span>
+</span><span id="L-544"><a href="#L-544"><span class="linenos">544</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">compute_subfeatures</span><span class="p">(</span>
+</span><span id="L-545"><a href="#L-545"><span class="linenos">545</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span>
+</span><span id="L-546"><a href="#L-546"><span class="linenos">546</span></a>        <span class="p">)</span>
+</span><span id="L-547"><a href="#L-547"><span class="linenos">547</span></a>
+</span><span id="L-548"><a href="#L-548"><span class="linenos">548</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span> <span class="o">&gt;</span> <span class="mi">1</span> <span class="ow">or</span> <span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span><span class="p">:</span>
+</span><span id="L-549"><a href="#L-549"><span class="linenos">549</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Constructing new features&#39;</span><span class="p">)</span>
+</span><span id="L-550"><a href="#L-550"><span class="linenos">550</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">compute_combined_features</span><span class="p">(</span>
+</span><span id="L-551"><a href="#L-551"><span class="linenos">551</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span>
+</span><span id="L-552"><a href="#L-552"><span class="linenos">552</span></a>        <span class="p">)</span>
+</span><span id="L-553"><a href="#L-553"><span class="linenos">553</span></a>
+</span><span id="L-554"><a href="#L-554"><span class="linenos">554</span></a>    <span class="c1"># in case of 3mr we compute the score of combinations against the target</span>
+</span><span id="L-555"><a href="#L-555"><span class="linenos">555</span></a>    <span class="k">if</span> <span class="s1">&#39;3mr&#39;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">:</span>
+</span><span id="L-556"><a href="#L-556"><span class="linenos">556</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span>
+</span><span id="L-557"><a href="#L-557"><span class="linenos">557</span></a>            <span class="s1">&#39;Constructing features for computing relations in 3mr&#39;</span><span class="p">,</span>
+</span><span id="L-558"><a href="#L-558"><span class="linenos">558</span></a>        <span class="p">)</span>
+</span><span id="L-559"><a href="#L-559"><span class="linenos">559</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">compute_combined_features</span><span class="p">(</span>
+</span><span id="L-560"><a href="#L-560"><span class="linenos">560</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="L-561"><a href="#L-561"><span class="linenos">561</span></a>        <span class="p">)</span>
+</span><span id="L-562"><a href="#L-562"><span class="linenos">562</span></a>
+</span><span id="L-563"><a href="#L-563"><span class="linenos">563</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">include_noise_baseline_features</span> <span class="o">==</span> <span class="s1">&#39;True&#39;</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">!=</span> <span class="s1">&#39;Constant&#39;</span><span class="p">:</span>
+</span><span id="L-564"><a href="#L-564"><span class="linenos">564</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Computing baseline features&#39;</span><span class="p">)</span>
+</span><span id="L-565"><a href="#L-565"><span class="linenos">565</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">include_noisy_features</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="L-566"><a href="#L-566"><span class="linenos">566</span></a>
+</span><span id="L-567"><a href="#L-567"><span class="linenos">567</span></a>    <span class="c1"># Compute incremental statistic useful for data inspection/transformer generation</span>
+</span><span id="L-568"><a href="#L-568"><span class="linenos">568</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Computing coverage&#39;</span><span class="p">)</span>
+</span><span id="L-569"><a href="#L-569"><span class="linenos">569</span></a>    <span class="n">coverage_storage</span> <span class="o">=</span> <span class="n">compute_coverage</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="L-570"><a href="#L-570"><span class="linenos">570</span></a>    <span class="n">feature_memory_consumption</span> <span class="o">=</span> <span class="n">compute_feature_memory_consumption</span><span class="p">(</span>
+</span><span id="L-571"><a href="#L-571"><span class="linenos">571</span></a>        <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span>
+</span><span id="L-572"><a href="#L-572"><span class="linenos">572</span></a>    <span class="p">)</span>
+</span><span id="L-573"><a href="#L-573"><span class="linenos">573</span></a>    <span class="n">compute_cardinalities</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">max_unique_hist_constraint</span><span class="p">)</span>
+</span><span id="L-574"><a href="#L-574"><span class="linenos">574</span></a>
+</span><span id="L-575"><a href="#L-575"><span class="linenos">575</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">task</span> <span class="o">==</span> <span class="s1">&#39;identify_rare_values&#39;</span><span class="p">:</span>
+</span><span id="L-576"><a href="#L-576"><span class="linenos">576</span></a>        <span class="n">compute_value_counts</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="L-577"><a href="#L-577"><span class="linenos">577</span></a>
+</span><span id="L-578"><a href="#L-578"><span class="linenos">578</span></a>    <span class="n">bounds_storage</span> <span class="o">=</span> <span class="n">compute_bounds_increment</span><span class="p">(</span>
+</span><span id="L-579"><a href="#L-579"><span class="linenos">579</span></a>        <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">numeric_column_types</span><span class="p">,</span>
+</span><span id="L-580"><a href="#L-580"><span class="linenos">580</span></a>    <span class="p">)</span>
+</span><span id="L-581"><a href="#L-581"><span class="linenos">581</span></a>
+</span><span id="L-582"><a href="#L-582"><span class="linenos">582</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span>
+</span><span id="L-583"><a href="#L-583"><span class="linenos">583</span></a>        <span class="sa">f</span><span class="s1">&#39;Computing ranks for </span><span class="si">{</span><span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s1"> features&#39;</span><span class="p">,</span>
+</span><span id="L-584"><a href="#L-584"><span class="linenos">584</span></a>    <span class="p">)</span>
+</span><span id="L-585"><a href="#L-585"><span class="linenos">585</span></a>
+</span><span id="L-586"><a href="#L-586"><span class="linenos">586</span></a>    <span class="k">return</span> <span class="p">(</span>
+</span><span id="L-587"><a href="#L-587"><span class="linenos">587</span></a>        <span class="n">mixed_rank_graph</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">cpu_pool</span><span class="p">,</span> <span class="n">pbar</span><span class="p">),</span>
+</span><span id="L-588"><a href="#L-588"><span class="linenos">588</span></a>        <span class="n">bounds_storage</span><span class="p">,</span>
+</span><span id="L-589"><a href="#L-589"><span class="linenos">589</span></a>        <span class="n">coverage_storage</span><span class="p">,</span>
+</span><span id="L-590"><a href="#L-590"><span class="linenos">590</span></a>        <span class="n">feature_memory_consumption</span><span class="p">,</span>
+</span><span id="L-591"><a href="#L-591"><span class="linenos">591</span></a>    <span class="p">)</span>
+</span><span id="L-592"><a href="#L-592"><span class="linenos">592</span></a>
+</span><span id="L-593"><a href="#L-593"><span class="linenos">593</span></a>
+</span><span id="L-594"><a href="#L-594"><span class="linenos">594</span></a><span class="k">def</span> <span class="nf">get_grouped_df</span><span class="p">(</span><span class="n">importances_df_list</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">]])</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="L-595"><a href="#L-595"><span class="linenos">595</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;A helper method that enables median-based aggregation after processing&quot;&quot;&quot;</span>
+</span><span id="L-596"><a href="#L-596"><span class="linenos">596</span></a>
+</span><span id="L-597"><a href="#L-597"><span class="linenos">597</span></a>    <span class="n">importances_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">importances_df_list</span><span class="p">)</span>
+</span><span id="L-598"><a href="#L-598"><span class="linenos">598</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">importances_df</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-599"><a href="#L-599"><span class="linenos">599</span></a>        <span class="k">return</span> <span class="kc">None</span>
+</span><span id="L-600"><a href="#L-600"><span class="linenos">600</span></a>    <span class="n">importances_df</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;FeatureA&#39;</span><span class="p">,</span> <span class="s1">&#39;FeatureB&#39;</span><span class="p">,</span> <span class="s1">&#39;Score&#39;</span><span class="p">]</span>
+</span><span id="L-601"><a href="#L-601"><span class="linenos">601</span></a>    <span class="n">grouped</span> <span class="o">=</span> <span class="n">importances_df</span><span class="o">.</span><span class="n">groupby</span><span class="p">(</span>
+</span><span id="L-602"><a href="#L-602"><span class="linenos">602</span></a>        <span class="p">[</span><span class="s1">&#39;FeatureA&#39;</span><span class="p">,</span> <span class="s1">&#39;FeatureB&#39;</span><span class="p">],</span>
+</span><span id="L-603"><a href="#L-603"><span class="linenos">603</span></a>    <span class="p">)</span><span class="o">.</span><span class="n">median</span><span class="p">()</span><span class="o">.</span><span class="n">reset_index</span><span class="p">()</span>
+</span><span id="L-604"><a href="#L-604"><span class="linenos">604</span></a>    <span class="k">return</span> <span class="n">grouped</span>
+</span><span id="L-605"><a href="#L-605"><span class="linenos">605</span></a>
+</span><span id="L-606"><a href="#L-606"><span class="linenos">606</span></a>
+</span><span id="L-607"><a href="#L-607"><span class="linenos">607</span></a><span class="k">def</span> <span class="nf">checkpoint_importances_df</span><span class="p">(</span><span class="n">importances_batch</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">]])</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-608"><a href="#L-608"><span class="linenos">608</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;A helper which stores intermediary state - useful for longer runs&quot;&quot;&quot;</span>
+</span><span id="L-609"><a href="#L-609"><span class="linenos">609</span></a>
+</span><span id="L-610"><a href="#L-610"><span class="linenos">610</span></a>    <span class="n">gdf</span> <span class="o">=</span> <span class="n">get_grouped_df</span><span class="p">(</span><span class="n">importances_batch</span><span class="p">)</span>
+</span><span id="L-611"><a href="#L-611"><span class="linenos">611</span></a>    <span class="k">if</span> <span class="n">gdf</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-612"><a href="#L-612"><span class="linenos">612</span></a>        <span class="n">gdf</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span><span class="s1">&#39;ranking_checkpoint_tmp.tsv&#39;</span><span class="p">,</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="L-613"><a href="#L-613"><span class="linenos">613</span></a>
+</span><span id="L-614"><a href="#L-614"><span class="linenos">614</span></a>
+</span><span id="L-615"><a href="#L-615"><span class="linenos">615</span></a><span class="k">def</span> <span class="nf">estimate_importances_minibatches</span><span class="p">(</span>
+</span><span id="L-616"><a href="#L-616"><span class="linenos">616</span></a>    <span class="n">input_file</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="L-617"><a href="#L-617"><span class="linenos">617</span></a>    <span class="n">column_descriptions</span><span class="p">:</span> <span class="nb">list</span><span class="p">,</span>
+</span><span id="L-618"><a href="#L-618"><span class="linenos">618</span></a>    <span class="n">fw_col_mapping</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span>
+</span><span id="L-619"><a href="#L-619"><span class="linenos">619</span></a>    <span class="n">numeric_column_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">,</span>
+</span><span id="L-620"><a href="#L-620"><span class="linenos">620</span></a>    <span class="n">batch_size</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">100000</span><span class="p">,</span>
+</span><span id="L-621"><a href="#L-621"><span class="linenos">621</span></a>    <span class="n">args</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-622"><a href="#L-622"><span class="linenos">622</span></a>    <span class="n">data_encoding</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;utf-8&#39;</span><span class="p">,</span>
+</span><span id="L-623"><a href="#L-623"><span class="linenos">623</span></a>    <span class="n">cpu_pool</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-624"><a href="#L-624"><span class="linenos">624</span></a>    <span class="n">delimiter</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="L-625"><a href="#L-625"><span class="linenos">625</span></a>    <span class="n">feature_construction_mode</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-626"><a href="#L-626"><span class="linenos">626</span></a>    <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-627"><a href="#L-627"><span class="linenos">627</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]],</span> <span class="n">Any</span><span class="p">,</span> <span class="nb">dict</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="nb">list</span><span class="p">[</span><span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]],</span> <span class="nb">list</span><span class="p">[</span><span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]],</span> <span class="n">defaultdict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]]:</span>
+</span><span id="L-628"><a href="#L-628"><span class="linenos">628</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Interaction score estimator - suitable for example for csv-like input data types.</span>
+</span><span id="L-629"><a href="#L-629"><span class="linenos">629</span></a><span class="sd">    This type of data is normally a single large csv, meaning that minibatch processing needs to</span>
+</span><span id="L-630"><a href="#L-630"><span class="linenos">630</span></a><span class="sd">    happen during incremental handling of the file (that&quot;s not the case for pre-separated ob data)</span>
+</span><span id="L-631"><a href="#L-631"><span class="linenos">631</span></a><span class="sd">    &quot;&quot;&quot;</span>
 </span><span id="L-632"><a href="#L-632"><span class="linenos">632</span></a>
-</span><span id="L-633"><a href="#L-633"><span class="linenos">633</span></a>    <span class="n">invalid_lines</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="L-634"><a href="#L-634"><span class="linenos">634</span></a>    <span class="n">line_counter</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="L-635"><a href="#L-635"><span class="linenos">635</span></a>
-</span><span id="L-636"><a href="#L-636"><span class="linenos">636</span></a>    <span class="n">importances_df</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-637"><a href="#L-637"><span class="linenos">637</span></a>    <span class="n">line_tmp_storage</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-638"><a href="#L-638"><span class="linenos">638</span></a>    <span class="n">bounds_storage_batch</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-639"><a href="#L-639"><span class="linenos">639</span></a>    <span class="n">memory_storage_batch</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-640"><a href="#L-640"><span class="linenos">640</span></a>    <span class="n">step_timing_checkpoints</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-641"><a href="#L-641"><span class="linenos">641</span></a>
-</span><span id="L-642"><a href="#L-642"><span class="linenos">642</span></a>    <span class="n">local_coverage_object</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
-</span><span id="L-643"><a href="#L-643"><span class="linenos">643</span></a>    <span class="n">local_pbar</span> <span class="o">=</span> <span class="n">tqdm</span><span class="o">.</span><span class="n">tqdm</span><span class="p">(</span>
-</span><span id="L-644"><a href="#L-644"><span class="linenos">644</span></a>        <span class="n">total</span><span class="o">=</span><span class="n">get_num_of_instances</span><span class="p">(</span><span class="n">input_file</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">,</span> <span class="n">position</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">disable</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">disable_tqdm</span> <span class="o">==</span> <span class="s1">&#39;True&#39;</span><span class="p">,</span>
-</span><span id="L-645"><a href="#L-645"><span class="linenos">645</span></a>    <span class="p">)</span>
-</span><span id="L-646"><a href="#L-646"><span class="linenos">646</span></a>
-</span><span id="L-647"><a href="#L-647"><span class="linenos">647</span></a>    <span class="n">file_name</span><span class="p">,</span> <span class="n">file_extension</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">splitext</span><span class="p">(</span><span class="n">input_file</span><span class="p">)</span>
+</span><span id="L-633"><a href="#L-633"><span class="linenos">633</span></a>    <span class="n">invalid_line_queue</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="n">deque</span><span class="p">([],</span> <span class="n">maxlen</span><span class="o">=</span><span class="mi">2</span><span class="o">**</span><span class="mi">5</span><span class="p">)</span>
+</span><span id="L-634"><a href="#L-634"><span class="linenos">634</span></a>
+</span><span id="L-635"><a href="#L-635"><span class="linenos">635</span></a>    <span class="n">invalid_lines</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-636"><a href="#L-636"><span class="linenos">636</span></a>    <span class="n">line_counter</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-637"><a href="#L-637"><span class="linenos">637</span></a>
+</span><span id="L-638"><a href="#L-638"><span class="linenos">638</span></a>    <span class="n">importances_df</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-639"><a href="#L-639"><span class="linenos">639</span></a>    <span class="n">line_tmp_storage</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-640"><a href="#L-640"><span class="linenos">640</span></a>    <span class="n">bounds_storage_batch</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-641"><a href="#L-641"><span class="linenos">641</span></a>    <span class="n">memory_storage_batch</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-642"><a href="#L-642"><span class="linenos">642</span></a>    <span class="n">step_timing_checkpoints</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-643"><a href="#L-643"><span class="linenos">643</span></a>
+</span><span id="L-644"><a href="#L-644"><span class="linenos">644</span></a>    <span class="n">local_coverage_object</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
+</span><span id="L-645"><a href="#L-645"><span class="linenos">645</span></a>    <span class="n">local_pbar</span> <span class="o">=</span> <span class="n">tqdm</span><span class="o">.</span><span class="n">tqdm</span><span class="p">(</span>
+</span><span id="L-646"><a href="#L-646"><span class="linenos">646</span></a>        <span class="n">total</span><span class="o">=</span><span class="n">get_num_of_instances</span><span class="p">(</span><span class="n">input_file</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">,</span> <span class="n">position</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">disable</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">disable_tqdm</span> <span class="o">==</span> <span class="s1">&#39;True&#39;</span><span class="p">,</span>
+</span><span id="L-647"><a href="#L-647"><span class="linenos">647</span></a>    <span class="p">)</span>
 </span><span id="L-648"><a href="#L-648"><span class="linenos">648</span></a>
-</span><span id="L-649"><a href="#L-649"><span class="linenos">649</span></a>    <span class="k">if</span> <span class="n">file_extension</span> <span class="o">==</span> <span class="s1">&#39;.gz&#39;</span><span class="p">:</span>
-</span><span id="L-650"><a href="#L-650"><span class="linenos">650</span></a>        <span class="n">file_stream</span> <span class="o">=</span> <span class="n">gzip</span><span class="o">.</span><span class="n">open</span><span class="p">(</span><span class="n">input_file</span><span class="p">,</span> <span class="s1">&#39;rt&#39;</span><span class="p">,</span> <span class="n">encoding</span><span class="o">=</span><span class="n">data_encoding</span><span class="p">)</span>
-</span><span id="L-651"><a href="#L-651"><span class="linenos">651</span></a>
-</span><span id="L-652"><a href="#L-652"><span class="linenos">652</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="L-653"><a href="#L-653"><span class="linenos">653</span></a>        <span class="n">file_stream</span> <span class="o">=</span> <span class="nb">open</span><span class="p">(</span><span class="n">input_file</span><span class="p">,</span> <span class="n">encoding</span><span class="o">=</span><span class="n">data_encoding</span><span class="p">)</span>
-</span><span id="L-654"><a href="#L-654"><span class="linenos">654</span></a>
-</span><span id="L-655"><a href="#L-655"><span class="linenos">655</span></a>    <span class="n">file_stream</span><span class="o">.</span><span class="n">readline</span><span class="p">()</span>
+</span><span id="L-649"><a href="#L-649"><span class="linenos">649</span></a>    <span class="n">file_name</span><span class="p">,</span> <span class="n">file_extension</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">splitext</span><span class="p">(</span><span class="n">input_file</span><span class="p">)</span>
+</span><span id="L-650"><a href="#L-650"><span class="linenos">650</span></a>
+</span><span id="L-651"><a href="#L-651"><span class="linenos">651</span></a>    <span class="k">if</span> <span class="n">file_extension</span> <span class="o">==</span> <span class="s1">&#39;.gz&#39;</span><span class="p">:</span>
+</span><span id="L-652"><a href="#L-652"><span class="linenos">652</span></a>        <span class="n">file_stream</span> <span class="o">=</span> <span class="n">gzip</span><span class="o">.</span><span class="n">open</span><span class="p">(</span><span class="n">input_file</span><span class="p">,</span> <span class="s1">&#39;rt&#39;</span><span class="p">,</span> <span class="n">encoding</span><span class="o">=</span><span class="n">data_encoding</span><span class="p">)</span>
+</span><span id="L-653"><a href="#L-653"><span class="linenos">653</span></a>
+</span><span id="L-654"><a href="#L-654"><span class="linenos">654</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="L-655"><a href="#L-655"><span class="linenos">655</span></a>        <span class="n">file_stream</span> <span class="o">=</span> <span class="nb">open</span><span class="p">(</span><span class="n">input_file</span><span class="p">,</span> <span class="n">encoding</span><span class="o">=</span><span class="n">data_encoding</span><span class="p">)</span>
 </span><span id="L-656"><a href="#L-656"><span class="linenos">656</span></a>
-</span><span id="L-657"><a href="#L-657"><span class="linenos">657</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Starting ranking computation&#39;</span><span class="p">)</span>
-</span><span id="L-658"><a href="#L-658"><span class="linenos">658</span></a>    <span class="k">for</span> <span class="n">line</span> <span class="ow">in</span> <span class="n">file_stream</span><span class="p">:</span>
-</span><span id="L-659"><a href="#L-659"><span class="linenos">659</span></a>        <span class="n">line_counter</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="L-660"><a href="#L-660"><span class="linenos">660</span></a>        <span class="n">local_pbar</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="L-661"><a href="#L-661"><span class="linenos">661</span></a>
-</span><span id="L-662"><a href="#L-662"><span class="linenos">662</span></a>        <span class="k">if</span> <span class="n">line_counter</span> <span class="o">%</span> <span class="n">args</span><span class="o">.</span><span class="n">subsampling</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="L-663"><a href="#L-663"><span class="linenos">663</span></a>            <span class="k">continue</span>
-</span><span id="L-664"><a href="#L-664"><span class="linenos">664</span></a>
-</span><span id="L-665"><a href="#L-665"><span class="linenos">665</span></a>        <span class="n">parsed_line</span> <span class="o">=</span> <span class="n">generic_line_parser</span><span class="p">(</span>
-</span><span id="L-666"><a href="#L-666"><span class="linenos">666</span></a>            <span class="n">line</span><span class="p">,</span> <span class="n">delimiter</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">fw_col_mapping</span><span class="p">,</span> <span class="n">column_descriptions</span><span class="p">,</span>
-</span><span id="L-667"><a href="#L-667"><span class="linenos">667</span></a>        <span class="p">)</span>
-</span><span id="L-668"><a href="#L-668"><span class="linenos">668</span></a>
-</span><span id="L-669"><a href="#L-669"><span class="linenos">669</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">parsed_line</span><span class="p">)</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">column_descriptions</span><span class="p">):</span>
-</span><span id="L-670"><a href="#L-670"><span class="linenos">670</span></a>            <span class="n">line_tmp_storage</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">parsed_line</span><span class="p">)</span>
-</span><span id="L-671"><a href="#L-671"><span class="linenos">671</span></a>
-</span><span id="L-672"><a href="#L-672"><span class="linenos">672</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-673"><a href="#L-673"><span class="linenos">673</span></a>            <span class="n">invalid_line_queue</span><span class="o">.</span><span class="n">appendleft</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">parsed_line</span><span class="p">))</span>
-</span><span id="L-674"><a href="#L-674"><span class="linenos">674</span></a>            <span class="n">invalid_lines</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="L-675"><a href="#L-675"><span class="linenos">675</span></a>
-</span><span id="L-676"><a href="#L-676"><span class="linenos">676</span></a>        <span class="c1"># Batches need to be processed on-the-fly</span>
-</span><span id="L-677"><a href="#L-677"><span class="linenos">677</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">line_tmp_storage</span><span class="p">)</span> <span class="o">&gt;=</span> <span class="n">args</span><span class="o">.</span><span class="n">minibatch_size</span><span class="p">:</span>
-</span><span id="L-678"><a href="#L-678"><span class="linenos">678</span></a>
-</span><span id="L-679"><a href="#L-679"><span class="linenos">679</span></a>            <span class="n">importances_batch</span><span class="p">,</span> <span class="n">bounds_storage</span><span class="p">,</span> <span class="n">coverage_storage</span><span class="p">,</span> <span class="n">memory_storage</span> <span class="o">=</span> <span class="n">compute_batch_ranking</span><span class="p">(</span>
-</span><span id="L-680"><a href="#L-680"><span class="linenos">680</span></a>                <span class="n">line_tmp_storage</span><span class="p">,</span>
-</span><span id="L-681"><a href="#L-681"><span class="linenos">681</span></a>                <span class="n">numeric_column_types</span><span class="p">,</span>
-</span><span id="L-682"><a href="#L-682"><span class="linenos">682</span></a>                <span class="n">args</span><span class="p">,</span>
-</span><span id="L-683"><a href="#L-683"><span class="linenos">683</span></a>                <span class="n">cpu_pool</span><span class="p">,</span>
-</span><span id="L-684"><a href="#L-684"><span class="linenos">684</span></a>                <span class="n">column_descriptions</span><span class="p">,</span>
-</span><span id="L-685"><a href="#L-685"><span class="linenos">685</span></a>                <span class="n">logger</span><span class="p">,</span>
-</span><span id="L-686"><a href="#L-686"><span class="linenos">686</span></a>                <span class="n">local_pbar</span><span class="p">,</span>
-</span><span id="L-687"><a href="#L-687"><span class="linenos">687</span></a>            <span class="p">)</span>
-</span><span id="L-688"><a href="#L-688"><span class="linenos">688</span></a>
-</span><span id="L-689"><a href="#L-689"><span class="linenos">689</span></a>            <span class="n">bounds_storage_batch</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">bounds_storage</span><span class="p">)</span>
-</span><span id="L-690"><a href="#L-690"><span class="linenos">690</span></a>            <span class="n">memory_storage_batch</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">memory_storage</span><span class="p">)</span>
-</span><span id="L-691"><a href="#L-691"><span class="linenos">691</span></a>            <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">coverage_storage</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="L-692"><a href="#L-692"><span class="linenos">692</span></a>                <span class="n">local_coverage_object</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">v</span><span class="p">)</span>
-</span><span id="L-693"><a href="#L-693"><span class="linenos">693</span></a>
-</span><span id="L-694"><a href="#L-694"><span class="linenos">694</span></a>            <span class="k">del</span> <span class="n">coverage_storage</span>
+</span><span id="L-657"><a href="#L-657"><span class="linenos">657</span></a>    <span class="n">file_stream</span><span class="o">.</span><span class="n">readline</span><span class="p">()</span>
+</span><span id="L-658"><a href="#L-658"><span class="linenos">658</span></a>
+</span><span id="L-659"><a href="#L-659"><span class="linenos">659</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Starting ranking computation&#39;</span><span class="p">)</span>
+</span><span id="L-660"><a href="#L-660"><span class="linenos">660</span></a>    <span class="k">for</span> <span class="n">line</span> <span class="ow">in</span> <span class="n">file_stream</span><span class="p">:</span>
+</span><span id="L-661"><a href="#L-661"><span class="linenos">661</span></a>        <span class="n">line_counter</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-662"><a href="#L-662"><span class="linenos">662</span></a>        <span class="n">local_pbar</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-663"><a href="#L-663"><span class="linenos">663</span></a>
+</span><span id="L-664"><a href="#L-664"><span class="linenos">664</span></a>        <span class="k">if</span> <span class="n">line_counter</span> <span class="o">%</span> <span class="n">args</span><span class="o">.</span><span class="n">subsampling</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-665"><a href="#L-665"><span class="linenos">665</span></a>            <span class="k">continue</span>
+</span><span id="L-666"><a href="#L-666"><span class="linenos">666</span></a>
+</span><span id="L-667"><a href="#L-667"><span class="linenos">667</span></a>        <span class="n">parsed_line</span> <span class="o">=</span> <span class="n">generic_line_parser</span><span class="p">(</span>
+</span><span id="L-668"><a href="#L-668"><span class="linenos">668</span></a>            <span class="n">line</span><span class="p">,</span> <span class="n">delimiter</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">fw_col_mapping</span><span class="p">,</span> <span class="n">column_descriptions</span><span class="p">,</span>
+</span><span id="L-669"><a href="#L-669"><span class="linenos">669</span></a>        <span class="p">)</span>
+</span><span id="L-670"><a href="#L-670"><span class="linenos">670</span></a>
+</span><span id="L-671"><a href="#L-671"><span class="linenos">671</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">parsed_line</span><span class="p">)</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">column_descriptions</span><span class="p">):</span>
+</span><span id="L-672"><a href="#L-672"><span class="linenos">672</span></a>            <span class="n">line_tmp_storage</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">parsed_line</span><span class="p">)</span>
+</span><span id="L-673"><a href="#L-673"><span class="linenos">673</span></a>
+</span><span id="L-674"><a href="#L-674"><span class="linenos">674</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-675"><a href="#L-675"><span class="linenos">675</span></a>            <span class="n">invalid_line_queue</span><span class="o">.</span><span class="n">appendleft</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">parsed_line</span><span class="p">))</span>
+</span><span id="L-676"><a href="#L-676"><span class="linenos">676</span></a>            <span class="n">invalid_lines</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-677"><a href="#L-677"><span class="linenos">677</span></a>
+</span><span id="L-678"><a href="#L-678"><span class="linenos">678</span></a>        <span class="c1"># Batches need to be processed on-the-fly</span>
+</span><span id="L-679"><a href="#L-679"><span class="linenos">679</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">line_tmp_storage</span><span class="p">)</span> <span class="o">&gt;=</span> <span class="n">args</span><span class="o">.</span><span class="n">minibatch_size</span><span class="p">:</span>
+</span><span id="L-680"><a href="#L-680"><span class="linenos">680</span></a>
+</span><span id="L-681"><a href="#L-681"><span class="linenos">681</span></a>            <span class="n">importances_batch</span><span class="p">,</span> <span class="n">bounds_storage</span><span class="p">,</span> <span class="n">coverage_storage</span><span class="p">,</span> <span class="n">memory_storage</span> <span class="o">=</span> <span class="n">compute_batch_ranking</span><span class="p">(</span>
+</span><span id="L-682"><a href="#L-682"><span class="linenos">682</span></a>                <span class="n">line_tmp_storage</span><span class="p">,</span>
+</span><span id="L-683"><a href="#L-683"><span class="linenos">683</span></a>                <span class="n">numeric_column_types</span><span class="p">,</span>
+</span><span id="L-684"><a href="#L-684"><span class="linenos">684</span></a>                <span class="n">args</span><span class="p">,</span>
+</span><span id="L-685"><a href="#L-685"><span class="linenos">685</span></a>                <span class="n">cpu_pool</span><span class="p">,</span>
+</span><span id="L-686"><a href="#L-686"><span class="linenos">686</span></a>                <span class="n">column_descriptions</span><span class="p">,</span>
+</span><span id="L-687"><a href="#L-687"><span class="linenos">687</span></a>                <span class="n">logger</span><span class="p">,</span>
+</span><span id="L-688"><a href="#L-688"><span class="linenos">688</span></a>                <span class="n">local_pbar</span><span class="p">,</span>
+</span><span id="L-689"><a href="#L-689"><span class="linenos">689</span></a>            <span class="p">)</span>
+</span><span id="L-690"><a href="#L-690"><span class="linenos">690</span></a>
+</span><span id="L-691"><a href="#L-691"><span class="linenos">691</span></a>            <span class="n">bounds_storage_batch</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">bounds_storage</span><span class="p">)</span>
+</span><span id="L-692"><a href="#L-692"><span class="linenos">692</span></a>            <span class="n">memory_storage_batch</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">memory_storage</span><span class="p">)</span>
+</span><span id="L-693"><a href="#L-693"><span class="linenos">693</span></a>            <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">coverage_storage</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-694"><a href="#L-694"><span class="linenos">694</span></a>                <span class="n">local_coverage_object</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">v</span><span class="p">)</span>
 </span><span id="L-695"><a href="#L-695"><span class="linenos">695</span></a>
-</span><span id="L-696"><a href="#L-696"><span class="linenos">696</span></a>            <span class="n">line_tmp_storage</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-697"><a href="#L-697"><span class="linenos">697</span></a>            <span class="n">step_timing_checkpoints</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">importances_batch</span><span class="o">.</span><span class="n">step_times</span><span class="p">)</span>
-</span><span id="L-698"><a href="#L-698"><span class="linenos">698</span></a>            <span class="n">importances_df</span> <span class="o">+=</span> <span class="n">importances_batch</span><span class="o">.</span><span class="n">triplet_scores</span>
-</span><span id="L-699"><a href="#L-699"><span class="linenos">699</span></a>
-</span><span id="L-700"><a href="#L-700"><span class="linenos">700</span></a>            <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">!=</span> <span class="s1">&#39;Constant&#39;</span><span class="p">:</span>
-</span><span id="L-701"><a href="#L-701"><span class="linenos">701</span></a>                <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Creating checkpoint&#39;</span><span class="p">)</span>
-</span><span id="L-702"><a href="#L-702"><span class="linenos">702</span></a>                <span class="n">checkpoint_importances_df</span><span class="p">(</span><span class="n">importances_df</span><span class="p">)</span>
-</span><span id="L-703"><a href="#L-703"><span class="linenos">703</span></a>
-</span><span id="L-704"><a href="#L-704"><span class="linenos">704</span></a>    <span class="n">file_stream</span><span class="o">.</span><span class="n">close</span><span class="p">()</span>
+</span><span id="L-696"><a href="#L-696"><span class="linenos">696</span></a>            <span class="k">del</span> <span class="n">coverage_storage</span>
+</span><span id="L-697"><a href="#L-697"><span class="linenos">697</span></a>
+</span><span id="L-698"><a href="#L-698"><span class="linenos">698</span></a>            <span class="n">line_tmp_storage</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-699"><a href="#L-699"><span class="linenos">699</span></a>            <span class="n">step_timing_checkpoints</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">importances_batch</span><span class="o">.</span><span class="n">step_times</span><span class="p">)</span>
+</span><span id="L-700"><a href="#L-700"><span class="linenos">700</span></a>            <span class="n">importances_df</span> <span class="o">+=</span> <span class="n">importances_batch</span><span class="o">.</span><span class="n">triplet_scores</span>
+</span><span id="L-701"><a href="#L-701"><span class="linenos">701</span></a>
+</span><span id="L-702"><a href="#L-702"><span class="linenos">702</span></a>            <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">!=</span> <span class="s1">&#39;Constant&#39;</span><span class="p">:</span>
+</span><span id="L-703"><a href="#L-703"><span class="linenos">703</span></a>                <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Creating checkpoint&#39;</span><span class="p">)</span>
+</span><span id="L-704"><a href="#L-704"><span class="linenos">704</span></a>                <span class="n">checkpoint_importances_df</span><span class="p">(</span><span class="n">importances_df</span><span class="p">)</span>
 </span><span id="L-705"><a href="#L-705"><span class="linenos">705</span></a>
-</span><span id="L-706"><a href="#L-706"><span class="linenos">706</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Parsing the remainder&#39;</span><span class="p">)</span>
-</span><span id="L-707"><a href="#L-707"><span class="linenos">707</span></a>    <span class="k">if</span> <span class="n">invalid_lines</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="L-708"><a href="#L-708"><span class="linenos">708</span></a>        <span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="L-709"><a href="#L-709"><span class="linenos">709</span></a>            <span class="sa">f</span><span class="s2">&quot;Detected </span><span class="si">{</span><span class="n">invalid_lines</span><span class="si">}</span><span class="s2"> invalid lines. If this number is very high, it&#39;s possible your header is off - re-check your data/attribute-feature mappings please!&quot;</span><span class="p">,</span>
-</span><span id="L-710"><a href="#L-710"><span class="linenos">710</span></a>        <span class="p">)</span>
-</span><span id="L-711"><a href="#L-711"><span class="linenos">711</span></a>
-</span><span id="L-712"><a href="#L-712"><span class="linenos">712</span></a>        <span class="n">invalid_lines_log</span> <span class="o">=</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1"> INVALID_LINE ====&gt; &#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
-</span><span id="L-713"><a href="#L-713"><span class="linenos">713</span></a>            <span class="nb">list</span><span class="p">(</span><span class="n">invalid_line_queue</span><span class="p">)[</span><span class="mi">0</span><span class="p">:</span><span class="mi">5</span><span class="p">],</span>
-</span><span id="L-714"><a href="#L-714"><span class="linenos">714</span></a>        <span class="p">)</span>
-</span><span id="L-715"><a href="#L-715"><span class="linenos">715</span></a>        <span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="L-716"><a href="#L-716"><span class="linenos">716</span></a>            <span class="sa">f</span><span class="s1">&#39;5 samples of invalid lines are printed below</span><span class="se">\n</span><span class="s1"> </span><span class="si">{</span><span class="n">invalid_lines_log</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="L-717"><a href="#L-717"><span class="linenos">717</span></a>        <span class="p">)</span>
-</span><span id="L-718"><a href="#L-718"><span class="linenos">718</span></a>
-</span><span id="L-719"><a href="#L-719"><span class="linenos">719</span></a>    <span class="n">remaining_batch_size</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">line_tmp_storage</span><span class="p">)</span>
+</span><span id="L-706"><a href="#L-706"><span class="linenos">706</span></a>    <span class="n">file_stream</span><span class="o">.</span><span class="n">close</span><span class="p">()</span>
+</span><span id="L-707"><a href="#L-707"><span class="linenos">707</span></a>
+</span><span id="L-708"><a href="#L-708"><span class="linenos">708</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Parsing the remainder&#39;</span><span class="p">)</span>
+</span><span id="L-709"><a href="#L-709"><span class="linenos">709</span></a>    <span class="k">if</span> <span class="n">invalid_lines</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-710"><a href="#L-710"><span class="linenos">710</span></a>        <span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="L-711"><a href="#L-711"><span class="linenos">711</span></a>            <span class="sa">f</span><span class="s2">&quot;Detected </span><span class="si">{</span><span class="n">invalid_lines</span><span class="si">}</span><span class="s2"> invalid lines. If this number is very high, it&#39;s possible your header is off - re-check your data/attribute-feature mappings please!&quot;</span><span class="p">,</span>
+</span><span id="L-712"><a href="#L-712"><span class="linenos">712</span></a>        <span class="p">)</span>
+</span><span id="L-713"><a href="#L-713"><span class="linenos">713</span></a>
+</span><span id="L-714"><a href="#L-714"><span class="linenos">714</span></a>        <span class="n">invalid_lines_log</span> <span class="o">=</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1"> INVALID_LINE ====&gt; &#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
+</span><span id="L-715"><a href="#L-715"><span class="linenos">715</span></a>            <span class="nb">list</span><span class="p">(</span><span class="n">invalid_line_queue</span><span class="p">)[</span><span class="mi">0</span><span class="p">:</span><span class="mi">5</span><span class="p">],</span>
+</span><span id="L-716"><a href="#L-716"><span class="linenos">716</span></a>        <span class="p">)</span>
+</span><span id="L-717"><a href="#L-717"><span class="linenos">717</span></a>        <span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="L-718"><a href="#L-718"><span class="linenos">718</span></a>            <span class="sa">f</span><span class="s1">&#39;5 samples of invalid lines are printed below</span><span class="se">\n</span><span class="s1"> </span><span class="si">{</span><span class="n">invalid_lines_log</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="L-719"><a href="#L-719"><span class="linenos">719</span></a>        <span class="p">)</span>
 </span><span id="L-720"><a href="#L-720"><span class="linenos">720</span></a>
-</span><span id="L-721"><a href="#L-721"><span class="linenos">721</span></a>    <span class="k">if</span> <span class="n">remaining_batch_size</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="o">**</span><span class="mi">10</span><span class="p">:</span>
-</span><span id="L-722"><a href="#L-722"><span class="linenos">722</span></a>        <span class="n">line_tmp_storage</span> <span class="o">=</span> <span class="n">line_tmp_storage</span><span class="p">[:</span> <span class="n">args</span><span class="o">.</span><span class="n">minibatch_size</span><span class="p">]</span>
-</span><span id="L-723"><a href="#L-723"><span class="linenos">723</span></a>        <span class="n">importances_batch</span><span class="p">,</span> <span class="n">bounds_storage</span><span class="p">,</span> <span class="n">coverage_storage</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">compute_batch_ranking</span><span class="p">(</span>
-</span><span id="L-724"><a href="#L-724"><span class="linenos">724</span></a>            <span class="n">line_tmp_storage</span><span class="p">,</span>
-</span><span id="L-725"><a href="#L-725"><span class="linenos">725</span></a>            <span class="n">numeric_column_types</span><span class="p">,</span>
-</span><span id="L-726"><a href="#L-726"><span class="linenos">726</span></a>            <span class="n">args</span><span class="p">,</span>
-</span><span id="L-727"><a href="#L-727"><span class="linenos">727</span></a>            <span class="n">cpu_pool</span><span class="p">,</span>
-</span><span id="L-728"><a href="#L-728"><span class="linenos">728</span></a>            <span class="n">column_descriptions</span><span class="p">,</span>
-</span><span id="L-729"><a href="#L-729"><span class="linenos">729</span></a>            <span class="n">logger</span><span class="p">,</span>
-</span><span id="L-730"><a href="#L-730"><span class="linenos">730</span></a>            <span class="n">local_pbar</span><span class="p">,</span>
-</span><span id="L-731"><a href="#L-731"><span class="linenos">731</span></a>        <span class="p">)</span>
-</span><span id="L-732"><a href="#L-732"><span class="linenos">732</span></a>
-</span><span id="L-733"><a href="#L-733"><span class="linenos">733</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">coverage_storage</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="L-734"><a href="#L-734"><span class="linenos">734</span></a>            <span class="n">local_coverage_object</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">v</span><span class="p">)</span>
-</span><span id="L-735"><a href="#L-735"><span class="linenos">735</span></a>
-</span><span id="L-736"><a href="#L-736"><span class="linenos">736</span></a>        <span class="n">step_timing_checkpoints</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">importances_batch</span><span class="o">.</span><span class="n">step_times</span><span class="p">)</span>
-</span><span id="L-737"><a href="#L-737"><span class="linenos">737</span></a>        <span class="n">importances_df</span> <span class="o">+=</span> <span class="n">importances_batch</span><span class="o">.</span><span class="n">triplet_scores</span>
-</span><span id="L-738"><a href="#L-738"><span class="linenos">738</span></a>        <span class="n">bounds_storage</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
-</span><span id="L-739"><a href="#L-739"><span class="linenos">739</span></a>        <span class="n">bounds_storage_batch</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">bounds_storage</span><span class="p">)</span>
-</span><span id="L-740"><a href="#L-740"><span class="linenos">740</span></a>        <span class="n">checkpoint_importances_df</span><span class="p">(</span><span class="n">importances_df</span><span class="p">)</span>
-</span><span id="L-741"><a href="#L-741"><span class="linenos">741</span></a>
-</span><span id="L-742"><a href="#L-742"><span class="linenos">742</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Wrapping up&#39;</span><span class="p">)</span>
-</span><span id="L-743"><a href="#L-743"><span class="linenos">743</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">close</span><span class="p">()</span>
-</span><span id="L-744"><a href="#L-744"><span class="linenos">744</span></a>
-</span><span id="L-745"><a href="#L-745"><span class="linenos">745</span></a>    <span class="k">return</span> <span class="p">(</span>
-</span><span id="L-746"><a href="#L-746"><span class="linenos">746</span></a>        <span class="n">step_timing_checkpoints</span><span class="p">,</span>
-</span><span id="L-747"><a href="#L-747"><span class="linenos">747</span></a>        <span class="n">get_grouped_df</span><span class="p">(</span><span class="n">importances_df</span><span class="p">),</span>
-</span><span id="L-748"><a href="#L-748"><span class="linenos">748</span></a>        <span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="o">.</span><span class="n">copy</span><span class="p">(),</span>
-</span><span id="L-749"><a href="#L-749"><span class="linenos">749</span></a>        <span class="n">bounds_storage_batch</span><span class="p">,</span>
-</span><span id="L-750"><a href="#L-750"><span class="linenos">750</span></a>        <span class="n">memory_storage_batch</span><span class="p">,</span>
-</span><span id="L-751"><a href="#L-751"><span class="linenos">751</span></a>        <span class="n">local_coverage_object</span><span class="p">,</span>
-</span><span id="L-752"><a href="#L-752"><span class="linenos">752</span></a>        <span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="o">.</span><span class="n">copy</span><span class="p">(),</span>
-</span><span id="L-753"><a href="#L-753"><span class="linenos">753</span></a>        <span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="o">.</span><span class="n">copy</span><span class="p">(),</span>
-</span><span id="L-754"><a href="#L-754"><span class="linenos">754</span></a>        <span class="n">GLOBAL_COUNTS_STORAGE</span><span class="o">.</span><span class="n">copy</span><span class="p">(),</span>
-</span><span id="L-755"><a href="#L-755"><span class="linenos">755</span></a>    <span class="p">)</span>
+</span><span id="L-721"><a href="#L-721"><span class="linenos">721</span></a>    <span class="n">remaining_batch_size</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">line_tmp_storage</span><span class="p">)</span>
+</span><span id="L-722"><a href="#L-722"><span class="linenos">722</span></a>
+</span><span id="L-723"><a href="#L-723"><span class="linenos">723</span></a>    <span class="k">if</span> <span class="n">remaining_batch_size</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="o">**</span><span class="mi">10</span><span class="p">:</span>
+</span><span id="L-724"><a href="#L-724"><span class="linenos">724</span></a>        <span class="n">line_tmp_storage</span> <span class="o">=</span> <span class="n">line_tmp_storage</span><span class="p">[:</span> <span class="n">args</span><span class="o">.</span><span class="n">minibatch_size</span><span class="p">]</span>
+</span><span id="L-725"><a href="#L-725"><span class="linenos">725</span></a>        <span class="n">importances_batch</span><span class="p">,</span> <span class="n">bounds_storage</span><span class="p">,</span> <span class="n">coverage_storage</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">compute_batch_ranking</span><span class="p">(</span>
+</span><span id="L-726"><a href="#L-726"><span class="linenos">726</span></a>            <span class="n">line_tmp_storage</span><span class="p">,</span>
+</span><span id="L-727"><a href="#L-727"><span class="linenos">727</span></a>            <span class="n">numeric_column_types</span><span class="p">,</span>
+</span><span id="L-728"><a href="#L-728"><span class="linenos">728</span></a>            <span class="n">args</span><span class="p">,</span>
+</span><span id="L-729"><a href="#L-729"><span class="linenos">729</span></a>            <span class="n">cpu_pool</span><span class="p">,</span>
+</span><span id="L-730"><a href="#L-730"><span class="linenos">730</span></a>            <span class="n">column_descriptions</span><span class="p">,</span>
+</span><span id="L-731"><a href="#L-731"><span class="linenos">731</span></a>            <span class="n">logger</span><span class="p">,</span>
+</span><span id="L-732"><a href="#L-732"><span class="linenos">732</span></a>            <span class="n">local_pbar</span><span class="p">,</span>
+</span><span id="L-733"><a href="#L-733"><span class="linenos">733</span></a>        <span class="p">)</span>
+</span><span id="L-734"><a href="#L-734"><span class="linenos">734</span></a>
+</span><span id="L-735"><a href="#L-735"><span class="linenos">735</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">coverage_storage</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-736"><a href="#L-736"><span class="linenos">736</span></a>            <span class="n">local_coverage_object</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">v</span><span class="p">)</span>
+</span><span id="L-737"><a href="#L-737"><span class="linenos">737</span></a>
+</span><span id="L-738"><a href="#L-738"><span class="linenos">738</span></a>        <span class="n">step_timing_checkpoints</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">importances_batch</span><span class="o">.</span><span class="n">step_times</span><span class="p">)</span>
+</span><span id="L-739"><a href="#L-739"><span class="linenos">739</span></a>        <span class="n">importances_df</span> <span class="o">+=</span> <span class="n">importances_batch</span><span class="o">.</span><span class="n">triplet_scores</span>
+</span><span id="L-740"><a href="#L-740"><span class="linenos">740</span></a>        <span class="n">bounds_storage</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
+</span><span id="L-741"><a href="#L-741"><span class="linenos">741</span></a>        <span class="n">bounds_storage_batch</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">bounds_storage</span><span class="p">)</span>
+</span><span id="L-742"><a href="#L-742"><span class="linenos">742</span></a>        <span class="n">checkpoint_importances_df</span><span class="p">(</span><span class="n">importances_df</span><span class="p">)</span>
+</span><span id="L-743"><a href="#L-743"><span class="linenos">743</span></a>
+</span><span id="L-744"><a href="#L-744"><span class="linenos">744</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Wrapping up&#39;</span><span class="p">)</span>
+</span><span id="L-745"><a href="#L-745"><span class="linenos">745</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">close</span><span class="p">()</span>
+</span><span id="L-746"><a href="#L-746"><span class="linenos">746</span></a>
+</span><span id="L-747"><a href="#L-747"><span class="linenos">747</span></a>    <span class="k">return</span> <span class="p">(</span>
+</span><span id="L-748"><a href="#L-748"><span class="linenos">748</span></a>        <span class="n">step_timing_checkpoints</span><span class="p">,</span>
+</span><span id="L-749"><a href="#L-749"><span class="linenos">749</span></a>        <span class="n">get_grouped_df</span><span class="p">(</span><span class="n">importances_df</span><span class="p">),</span>
+</span><span id="L-750"><a href="#L-750"><span class="linenos">750</span></a>        <span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="o">.</span><span class="n">copy</span><span class="p">(),</span>
+</span><span id="L-751"><a href="#L-751"><span class="linenos">751</span></a>        <span class="n">bounds_storage_batch</span><span class="p">,</span>
+</span><span id="L-752"><a href="#L-752"><span class="linenos">752</span></a>        <span class="n">memory_storage_batch</span><span class="p">,</span>
+</span><span id="L-753"><a href="#L-753"><span class="linenos">753</span></a>        <span class="n">local_coverage_object</span><span class="p">,</span>
+</span><span id="L-754"><a href="#L-754"><span class="linenos">754</span></a>        <span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="o">.</span><span class="n">copy</span><span class="p">(),</span>
+</span><span id="L-755"><a href="#L-755"><span class="linenos">755</span></a>        <span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="o">.</span><span class="n">copy</span><span class="p">(),</span>
+</span><span id="L-756"><a href="#L-756"><span class="linenos">756</span></a>        <span class="n">GLOBAL_COUNTS_STORAGE</span><span class="o">.</span><span class="n">copy</span><span class="p">(),</span>
+</span><span id="L-757"><a href="#L-757"><span class="linenos">757</span></a>    <span class="p">)</span>
 </span></pre></div>
 
 
@@ -893,11 +892,11 @@ <h1 class="modulename">
             <span class="name">logger</span>        =
 <span class="default_value">&lt;Logger syn-logger (DEBUG)&gt;</span>
 
-
+        
     </div>
     <a class="headerlink" href="#logger"></a>
-
-
+    
+    
 
                 </section>
                 <section id="GLOBAL_CARDINALITY_STORAGE">
@@ -905,11 +904,11 @@ <h1 class="modulename">
             <span class="name">GLOBAL_CARDINALITY_STORAGE</span><span class="annotation">: dict[typing.Any, typing.Any]</span>        =
 <span class="default_value">{}</span>
 
-
+        
     </div>
     <a class="headerlink" href="#GLOBAL_CARDINALITY_STORAGE"></a>
-
-
+    
+    
 
                 </section>
                 <section id="GLOBAL_COUNTS_STORAGE">
@@ -917,11 +916,11 @@ <h1 class="modulename">
             <span class="name">GLOBAL_COUNTS_STORAGE</span><span class="annotation">: dict[typing.Any, typing.Any]</span>        =
 <span class="default_value">{}</span>
 
-
+        
     </div>
     <a class="headerlink" href="#GLOBAL_COUNTS_STORAGE"></a>
-
-
+    
+    
 
                 </section>
                 <section id="GLOBAL_RARE_VALUE_STORAGE">
@@ -929,11 +928,11 @@ <h1 class="modulename">
             <span class="name">GLOBAL_RARE_VALUE_STORAGE</span><span class="annotation">: dict[str, typing.Any]</span>        =
 <span class="default_value">Counter()</span>
 
-
+        
     </div>
     <a class="headerlink" href="#GLOBAL_RARE_VALUE_STORAGE"></a>
-
-
+    
+    
 
                 </section>
                 <section id="GLOBAL_PRIOR_COMB_COUNTS">
@@ -941,11 +940,11 @@ <h1 class="modulename">
             <span class="name">GLOBAL_PRIOR_COMB_COUNTS</span><span class="annotation">: dict[typing.Any, int]</span>        =
 <span class="default_value">Counter()</span>
 
-
+        
     </div>
     <a class="headerlink" href="#GLOBAL_PRIOR_COMB_COUNTS"></a>
-
-
+    
+    
 
                 </section>
                 <section id="IGNORED_VALUES">
@@ -953,11 +952,11 @@ <h1 class="modulename">
             <span class="name">IGNORED_VALUES</span>        =
 <span class="default_value">set()</span>
 
-
+        
     </div>
     <a class="headerlink" href="#IGNORED_VALUES"></a>
-
-
+    
+    
 
                 </section>
                 <section id="HYPERLL_ERROR_BOUND">
@@ -965,11 +964,11 @@ <h1 class="modulename">
             <span class="name">HYPERLL_ERROR_BOUND</span>        =
 <span class="default_value">0.02</span>
 
-
+        
     </div>
     <a class="headerlink" href="#HYPERLL_ERROR_BOUND"></a>
-
-
+    
+    
 
                 </section>
                 <section id="MAX_FEATURES_3MR">
@@ -977,17 +976,17 @@ <h1 class="modulename">
             <span class="name">MAX_FEATURES_3MR</span>        =
 <span class="default_value">10000</span>
 
-
+        
     </div>
     <a class="headerlink" href="#MAX_FEATURES_3MR"></a>
-
-
+    
+    
 
                 </section>
                 <section id="prior_combinations_sample">
                             <input id="prior_combinations_sample-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">prior_combinations_sample</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">combinations</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">,</span> <span class="o">...</span><span class="p">]]</span>,</span><span class="param">	<span class="n">args</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">,</span> <span class="o">...</span><span class="p">]]</span>:</span></span>
 
@@ -995,20 +994,23 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#prior_combinations_sample"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="prior_combinations_sample-51"><a href="#prior_combinations_sample-51"><span class="linenos">51</span></a><span class="k">def</span> <span class="nf">prior_combinations_sample</span><span class="p">(</span><span class="n">combinations</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="o">...</span><span class="p">]],</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="o">...</span><span class="p">]]:</span>
-</span><span id="prior_combinations_sample-52"><a href="#prior_combinations_sample-52"><span class="linenos">52</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Make sure only relevant subspace of combinations is selected based on prior counts&quot;&quot;&quot;</span>
-</span><span id="prior_combinations_sample-53"><a href="#prior_combinations_sample-53"><span class="linenos">53</span></a>
-</span><span id="prior_combinations_sample-54"><a href="#prior_combinations_sample-54"><span class="linenos">54</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="prior_combinations_sample-55"><a href="#prior_combinations_sample-55"><span class="linenos">55</span></a>        <span class="k">for</span> <span class="n">combination</span> <span class="ow">in</span> <span class="n">combinations</span><span class="p">:</span>
-</span><span id="prior_combinations_sample-56"><a href="#prior_combinations_sample-56"><span class="linenos">56</span></a>            <span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="p">[</span><span class="n">combination</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="prior_combinations_sample-57"><a href="#prior_combinations_sample-57"><span class="linenos">57</span></a>        <span class="n">tmp</span> <span class="o">=</span> <span class="n">combinations</span><span class="p">[:</span><span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span><span class="p">]</span>
-</span><span id="prior_combinations_sample-58"><a href="#prior_combinations_sample-58"><span class="linenos">58</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="prior_combinations_sample-59"><a href="#prior_combinations_sample-59"><span class="linenos">59</span></a>        <span class="n">tmp</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">sorted</span><span class="p">(</span><span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="o">.</span><span class="n">items</span><span class="p">(),</span> <span class="n">key</span><span class="o">=</span><span class="k">lambda</span> <span class="n">x</span><span class="p">:</span><span class="n">x</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">reverse</span><span class="o">=</span><span class="kc">False</span><span class="p">))[:</span><span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span><span class="p">]</span>
-</span><span id="prior_combinations_sample-60"><a href="#prior_combinations_sample-60"><span class="linenos">60</span></a>
-</span><span id="prior_combinations_sample-61"><a href="#prior_combinations_sample-61"><span class="linenos">61</span></a>    <span class="k">for</span> <span class="n">combination</span> <span class="ow">in</span> <span class="n">tmp</span><span class="p">:</span>
-</span><span id="prior_combinations_sample-62"><a href="#prior_combinations_sample-62"><span class="linenos">62</span></a>        <span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="p">[</span><span class="n">combination</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="prior_combinations_sample-63"><a href="#prior_combinations_sample-63"><span class="linenos">63</span></a>
-</span><span id="prior_combinations_sample-64"><a href="#prior_combinations_sample-64"><span class="linenos">64</span></a>    <span class="k">return</span> <span class="n">tmp</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="prior_combinations_sample-54"><a href="#prior_combinations_sample-54"><span class="linenos">54</span></a><span class="k">def</span> <span class="nf">prior_combinations_sample</span><span class="p">(</span><span class="n">combinations</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="o">...</span><span class="p">]],</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="o">...</span><span class="p">]]:</span>
+</span><span id="prior_combinations_sample-55"><a href="#prior_combinations_sample-55"><span class="linenos">55</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Make sure only relevant subspace of combinations is selected based on prior counts&quot;&quot;&quot;</span>
+</span><span id="prior_combinations_sample-56"><a href="#prior_combinations_sample-56"><span class="linenos">56</span></a>
+</span><span id="prior_combinations_sample-57"><a href="#prior_combinations_sample-57"><span class="linenos">57</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">combinations</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="prior_combinations_sample-58"><a href="#prior_combinations_sample-58"><span class="linenos">58</span></a>        <span class="k">return</span> <span class="p">[]</span>
+</span><span id="prior_combinations_sample-59"><a href="#prior_combinations_sample-59"><span class="linenos">59</span></a>
+</span><span id="prior_combinations_sample-60"><a href="#prior_combinations_sample-60"><span class="linenos">60</span></a>    <span class="n">missing_combinations</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">combinations</span><span class="p">))</span><span class="o">.</span><span class="n">difference</span><span class="p">(</span><span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span>
+</span><span id="prior_combinations_sample-61"><a href="#prior_combinations_sample-61"><span class="linenos">61</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">missing_combinations</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="prior_combinations_sample-62"><a href="#prior_combinations_sample-62"><span class="linenos">62</span></a>        <span class="k">for</span> <span class="n">combination</span> <span class="ow">in</span> <span class="n">missing_combinations</span><span class="p">:</span>
+</span><span id="prior_combinations_sample-63"><a href="#prior_combinations_sample-63"><span class="linenos">63</span></a>            <span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="p">[</span><span class="n">combination</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="prior_combinations_sample-64"><a href="#prior_combinations_sample-64"><span class="linenos">64</span></a>
+</span><span id="prior_combinations_sample-65"><a href="#prior_combinations_sample-65"><span class="linenos">65</span></a>    <span class="n">tmp</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span><span class="n">combinations</span><span class="p">,</span> <span class="n">key</span><span class="o">=</span><span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="o">.</span><span class="n">get</span><span class="p">,</span> <span class="n">reverse</span><span class="o">=</span><span class="kc">False</span><span class="p">)[:</span><span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span><span class="p">]</span>
+</span><span id="prior_combinations_sample-66"><a href="#prior_combinations_sample-66"><span class="linenos">66</span></a>
+</span><span id="prior_combinations_sample-67"><a href="#prior_combinations_sample-67"><span class="linenos">67</span></a>    <span class="k">for</span> <span class="n">combination</span> <span class="ow">in</span> <span class="n">tmp</span><span class="p">:</span>
+</span><span id="prior_combinations_sample-68"><a href="#prior_combinations_sample-68"><span class="linenos">68</span></a>        <span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="p">[</span><span class="n">combination</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="prior_combinations_sample-69"><a href="#prior_combinations_sample-69"><span class="linenos">69</span></a>
+</span><span id="prior_combinations_sample-70"><a href="#prior_combinations_sample-70"><span class="linenos">70</span></a>    <span class="k">return</span> <span class="n">tmp</span>
 </span></pre></div>
 
 
@@ -1020,7 +1022,7 @@ <h1 class="modulename">
                 <section id="get_combinations_from_columns">
                             <input id="get_combinations_from_columns-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">get_combinations_from_columns</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">all_columns</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">indexes</span><span class="o">.</span><span class="n">base</span><span class="o">.</span><span class="n">Index</span>,</span><span class="param">	<span class="n">args</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">,</span> <span class="o">...</span><span class="p">]]</span>:</span></span>
 
@@ -1028,36 +1030,36 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#get_combinations_from_columns"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="get_combinations_from_columns-67"><a href="#get_combinations_from_columns-67"><span class="linenos">67</span></a><span class="k">def</span> <span class="nf">get_combinations_from_columns</span><span class="p">(</span><span class="n">all_columns</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Index</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="o">...</span><span class="p">]]:</span>
-</span><span id="get_combinations_from_columns-68"><a href="#get_combinations_from_columns-68"><span class="linenos">68</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Return feature-feature &amp; feature-label combinations, depending on the heuristic and ranking scope&quot;&quot;&quot;</span>
-</span><span id="get_combinations_from_columns-69"><a href="#get_combinations_from_columns-69"><span class="linenos">69</span></a>
-</span><span id="get_combinations_from_columns-70"><a href="#get_combinations_from_columns-70"><span class="linenos">70</span></a>    <span class="k">if</span> <span class="s1">&#39;3mr&#39;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">:</span>
-</span><span id="get_combinations_from_columns-71"><a href="#get_combinations_from_columns-71"><span class="linenos">71</span></a>        <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span> <span class="o">&gt;</span> <span class="n">MAX_FEATURES_3MR</span><span class="p">:</span>
-</span><span id="get_combinations_from_columns-72"><a href="#get_combinations_from_columns-72"><span class="linenos">72</span></a>            <span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span> <span class="o">=</span> <span class="n">MAX_FEATURES_3MR</span>
-</span><span id="get_combinations_from_columns-73"><a href="#get_combinations_from_columns-73"><span class="linenos">73</span></a>        <span class="n">rel_columns</span> <span class="o">=</span> <span class="p">[</span><span class="n">column</span> <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">all_columns</span> <span class="k">if</span> <span class="s1">&#39; AND_REL &#39;</span> <span class="ow">in</span> <span class="n">column</span><span class="p">]</span>
-</span><span id="get_combinations_from_columns-74"><a href="#get_combinations_from_columns-74"><span class="linenos">74</span></a>        <span class="n">non_rel_columns</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">all_columns</span><span class="p">)</span> <span class="o">-</span> <span class="nb">set</span><span class="p">(</span><span class="n">rel_columns</span><span class="p">))</span>
-</span><span id="get_combinations_from_columns-75"><a href="#get_combinations_from_columns-75"><span class="linenos">75</span></a>
-</span><span id="get_combinations_from_columns-76"><a href="#get_combinations_from_columns-76"><span class="linenos">76</span></a>        <span class="n">combinations</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span>
-</span><span id="get_combinations_from_columns-77"><a href="#get_combinations_from_columns-77"><span class="linenos">77</span></a>            <span class="n">itertools</span><span class="o">.</span><span class="n">combinations_with_replacement</span><span class="p">(</span><span class="n">non_rel_columns</span><span class="p">,</span> <span class="mi">2</span><span class="p">),</span>
-</span><span id="get_combinations_from_columns-78"><a href="#get_combinations_from_columns-78"><span class="linenos">78</span></a>        <span class="p">)</span>
-</span><span id="get_combinations_from_columns-79"><a href="#get_combinations_from_columns-79"><span class="linenos">79</span></a>        <span class="n">combinations</span> <span class="o">+=</span> <span class="p">[(</span><span class="n">column</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span><span class="p">)</span> <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">rel_columns</span><span class="p">]</span>
-</span><span id="get_combinations_from_columns-80"><a href="#get_combinations_from_columns-80"><span class="linenos">80</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="get_combinations_from_columns-81"><a href="#get_combinations_from_columns-81"><span class="linenos">81</span></a>        <span class="n">_combinations</span> <span class="o">=</span> <span class="n">itertools</span><span class="o">.</span><span class="n">combinations_with_replacement</span><span class="p">(</span><span class="n">all_columns</span><span class="p">,</span> <span class="mi">2</span><span class="p">)</span>
-</span><span id="get_combinations_from_columns-82"><a href="#get_combinations_from_columns-82"><span class="linenos">82</span></a>
-</span><span id="get_combinations_from_columns-83"><a href="#get_combinations_from_columns-83"><span class="linenos">83</span></a>        <span class="c1"># Some applications do not require the full feature-feature triangular matrix</span>
-</span><span id="get_combinations_from_columns-84"><a href="#get_combinations_from_columns-84"><span class="linenos">84</span></a>        <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">target_ranking_only</span> <span class="o">==</span> <span class="s1">&#39;True&#39;</span><span class="p">:</span>
-</span><span id="get_combinations_from_columns-85"><a href="#get_combinations_from_columns-85"><span class="linenos">85</span></a>            <span class="n">combinations</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">_combinations</span> <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span> <span class="ow">in</span> <span class="n">x</span><span class="p">]</span>
-</span><span id="get_combinations_from_columns-86"><a href="#get_combinations_from_columns-86"><span class="linenos">86</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="get_combinations_from_columns-87"><a href="#get_combinations_from_columns-87"><span class="linenos">87</span></a>            <span class="n">combinations</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">_combinations</span><span class="p">)</span>
-</span><span id="get_combinations_from_columns-88"><a href="#get_combinations_from_columns-88"><span class="linenos">88</span></a>
-</span><span id="get_combinations_from_columns-89"><a href="#get_combinations_from_columns-89"><span class="linenos">89</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">target_ranking_only</span> <span class="o">!=</span> <span class="s1">&#39;True&#39;</span><span class="p">:</span>
-</span><span id="get_combinations_from_columns-90"><a href="#get_combinations_from_columns-90"><span class="linenos">90</span></a>        <span class="c1"># Diagonal elements (non-label)</span>
-</span><span id="get_combinations_from_columns-91"><a href="#get_combinations_from_columns-91"><span class="linenos">91</span></a>        <span class="n">combinations</span> <span class="o">+=</span> <span class="p">[</span>
-</span><span id="get_combinations_from_columns-92"><a href="#get_combinations_from_columns-92"><span class="linenos">92</span></a>            <span class="p">(</span><span class="n">individual_column</span><span class="p">,</span> <span class="n">individual_column</span><span class="p">)</span>
-</span><span id="get_combinations_from_columns-93"><a href="#get_combinations_from_columns-93"><span class="linenos">93</span></a>            <span class="k">for</span> <span class="n">individual_column</span> <span class="ow">in</span> <span class="n">all_columns</span>
-</span><span id="get_combinations_from_columns-94"><a href="#get_combinations_from_columns-94"><span class="linenos">94</span></a>            <span class="k">if</span> <span class="n">individual_column</span> <span class="o">!=</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span>
-</span><span id="get_combinations_from_columns-95"><a href="#get_combinations_from_columns-95"><span class="linenos">95</span></a>        <span class="p">]</span>
-</span><span id="get_combinations_from_columns-96"><a href="#get_combinations_from_columns-96"><span class="linenos">96</span></a>    <span class="k">return</span> <span class="n">combinations</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="get_combinations_from_columns-73"><a href="#get_combinations_from_columns-73"><span class="linenos"> 73</span></a><span class="k">def</span> <span class="nf">get_combinations_from_columns</span><span class="p">(</span><span class="n">all_columns</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Index</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="o">...</span><span class="p">]]:</span>
+</span><span id="get_combinations_from_columns-74"><a href="#get_combinations_from_columns-74"><span class="linenos"> 74</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Return feature-feature &amp; feature-label combinations, depending on the heuristic and ranking scope&quot;&quot;&quot;</span>
+</span><span id="get_combinations_from_columns-75"><a href="#get_combinations_from_columns-75"><span class="linenos"> 75</span></a>
+</span><span id="get_combinations_from_columns-76"><a href="#get_combinations_from_columns-76"><span class="linenos"> 76</span></a>    <span class="k">if</span> <span class="s1">&#39;3mr&#39;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">:</span>
+</span><span id="get_combinations_from_columns-77"><a href="#get_combinations_from_columns-77"><span class="linenos"> 77</span></a>        <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span> <span class="o">&gt;</span> <span class="n">MAX_FEATURES_3MR</span><span class="p">:</span>
+</span><span id="get_combinations_from_columns-78"><a href="#get_combinations_from_columns-78"><span class="linenos"> 78</span></a>            <span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span> <span class="o">=</span> <span class="n">MAX_FEATURES_3MR</span>
+</span><span id="get_combinations_from_columns-79"><a href="#get_combinations_from_columns-79"><span class="linenos"> 79</span></a>        <span class="n">rel_columns</span> <span class="o">=</span> <span class="p">[</span><span class="n">column</span> <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">all_columns</span> <span class="k">if</span> <span class="s1">&#39; AND_REL &#39;</span> <span class="ow">in</span> <span class="n">column</span><span class="p">]</span>
+</span><span id="get_combinations_from_columns-80"><a href="#get_combinations_from_columns-80"><span class="linenos"> 80</span></a>        <span class="n">non_rel_columns</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">all_columns</span><span class="p">)</span> <span class="o">-</span> <span class="nb">set</span><span class="p">(</span><span class="n">rel_columns</span><span class="p">))</span>
+</span><span id="get_combinations_from_columns-81"><a href="#get_combinations_from_columns-81"><span class="linenos"> 81</span></a>
+</span><span id="get_combinations_from_columns-82"><a href="#get_combinations_from_columns-82"><span class="linenos"> 82</span></a>        <span class="n">combinations</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span>
+</span><span id="get_combinations_from_columns-83"><a href="#get_combinations_from_columns-83"><span class="linenos"> 83</span></a>            <span class="n">itertools</span><span class="o">.</span><span class="n">combinations_with_replacement</span><span class="p">(</span><span class="n">non_rel_columns</span><span class="p">,</span> <span class="mi">2</span><span class="p">),</span>
+</span><span id="get_combinations_from_columns-84"><a href="#get_combinations_from_columns-84"><span class="linenos"> 84</span></a>        <span class="p">)</span>
+</span><span id="get_combinations_from_columns-85"><a href="#get_combinations_from_columns-85"><span class="linenos"> 85</span></a>        <span class="n">combinations</span> <span class="o">+=</span> <span class="p">[(</span><span class="n">column</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span><span class="p">)</span> <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">rel_columns</span><span class="p">]</span>
+</span><span id="get_combinations_from_columns-86"><a href="#get_combinations_from_columns-86"><span class="linenos"> 86</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="get_combinations_from_columns-87"><a href="#get_combinations_from_columns-87"><span class="linenos"> 87</span></a>        <span class="n">_combinations</span> <span class="o">=</span> <span class="n">itertools</span><span class="o">.</span><span class="n">combinations_with_replacement</span><span class="p">(</span><span class="n">all_columns</span><span class="p">,</span> <span class="mi">2</span><span class="p">)</span>
+</span><span id="get_combinations_from_columns-88"><a href="#get_combinations_from_columns-88"><span class="linenos"> 88</span></a>
+</span><span id="get_combinations_from_columns-89"><a href="#get_combinations_from_columns-89"><span class="linenos"> 89</span></a>        <span class="c1"># Some applications do not require the full feature-feature triangular matrix</span>
+</span><span id="get_combinations_from_columns-90"><a href="#get_combinations_from_columns-90"><span class="linenos"> 90</span></a>        <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">target_ranking_only</span> <span class="o">==</span> <span class="s1">&#39;True&#39;</span><span class="p">:</span>
+</span><span id="get_combinations_from_columns-91"><a href="#get_combinations_from_columns-91"><span class="linenos"> 91</span></a>            <span class="n">combinations</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">_combinations</span> <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span> <span class="ow">in</span> <span class="n">x</span><span class="p">]</span>
+</span><span id="get_combinations_from_columns-92"><a href="#get_combinations_from_columns-92"><span class="linenos"> 92</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="get_combinations_from_columns-93"><a href="#get_combinations_from_columns-93"><span class="linenos"> 93</span></a>            <span class="n">combinations</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">_combinations</span><span class="p">)</span>
+</span><span id="get_combinations_from_columns-94"><a href="#get_combinations_from_columns-94"><span class="linenos"> 94</span></a>
+</span><span id="get_combinations_from_columns-95"><a href="#get_combinations_from_columns-95"><span class="linenos"> 95</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">target_ranking_only</span> <span class="o">!=</span> <span class="s1">&#39;True&#39;</span><span class="p">:</span>
+</span><span id="get_combinations_from_columns-96"><a href="#get_combinations_from_columns-96"><span class="linenos"> 96</span></a>        <span class="c1"># Diagonal elements (non-label)</span>
+</span><span id="get_combinations_from_columns-97"><a href="#get_combinations_from_columns-97"><span class="linenos"> 97</span></a>        <span class="n">combinations</span> <span class="o">+=</span> <span class="p">[</span>
+</span><span id="get_combinations_from_columns-98"><a href="#get_combinations_from_columns-98"><span class="linenos"> 98</span></a>            <span class="p">(</span><span class="n">individual_column</span><span class="p">,</span> <span class="n">individual_column</span><span class="p">)</span>
+</span><span id="get_combinations_from_columns-99"><a href="#get_combinations_from_columns-99"><span class="linenos"> 99</span></a>            <span class="k">for</span> <span class="n">individual_column</span> <span class="ow">in</span> <span class="n">all_columns</span>
+</span><span id="get_combinations_from_columns-100"><a href="#get_combinations_from_columns-100"><span class="linenos">100</span></a>            <span class="k">if</span> <span class="n">individual_column</span> <span class="o">!=</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span>
+</span><span id="get_combinations_from_columns-101"><a href="#get_combinations_from_columns-101"><span class="linenos">101</span></a>        <span class="p">]</span>
+</span><span id="get_combinations_from_columns-102"><a href="#get_combinations_from_columns-102"><span class="linenos">102</span></a>    <span class="k">return</span> <span class="n">combinations</span>
 </span></pre></div>
 
 
@@ -1069,7 +1071,7 @@ <h1 class="modulename">
                 <section id="mixed_rank_graph">
                             <input id="mixed_rank_graph-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">mixed_rank_graph</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>,</span><span class="param">	<span class="n">args</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">cpu_pool</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="n"><a href="core_utils.html#BatchRankingSummary">outrank.core_utils.BatchRankingSummary</a></span>:</span></span>
 
@@ -1077,67 +1079,73 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#mixed_rank_graph"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="mixed_rank_graph-99"><a href="#mixed_rank_graph-99"><span class="linenos"> 99</span></a><span class="k">def</span> <span class="nf">mixed_rank_graph</span><span class="p">(</span>
-</span><span id="mixed_rank_graph-100"><a href="#mixed_rank_graph-100"><span class="linenos">100</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">cpu_pool</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="mixed_rank_graph-101"><a href="#mixed_rank_graph-101"><span class="linenos">101</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">BatchRankingSummary</span><span class="p">:</span>
-</span><span id="mixed_rank_graph-102"><a href="#mixed_rank_graph-102"><span class="linenos">102</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute the full mixed rank graph corresponding to all pairwise feature interactions based on the selected heuristic&quot;&quot;&quot;</span>
-</span><span id="mixed_rank_graph-103"><a href="#mixed_rank_graph-103"><span class="linenos">103</span></a>
-</span><span id="mixed_rank_graph-104"><a href="#mixed_rank_graph-104"><span class="linenos">104</span></a>    <span class="n">all_columns</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span>
-</span><span id="mixed_rank_graph-105"><a href="#mixed_rank_graph-105"><span class="linenos">105</span></a>
-</span><span id="mixed_rank_graph-106"><a href="#mixed_rank_graph-106"><span class="linenos">106</span></a>    <span class="n">triplets</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="mixed_rank_graph-107"><a href="#mixed_rank_graph-107"><span class="linenos">107</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="s1">&#39;category&#39;</span><span class="p">)</span>
-</span><span id="mixed_rank_graph-108"><a href="#mixed_rank_graph-108"><span class="linenos">108</span></a>    <span class="n">out_time_struct</span> <span class="o">=</span> <span class="p">{}</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="mixed_rank_graph-105"><a href="#mixed_rank_graph-105"><span class="linenos">105</span></a><span class="k">def</span> <span class="nf">mixed_rank_graph</span><span class="p">(</span>
+</span><span id="mixed_rank_graph-106"><a href="#mixed_rank_graph-106"><span class="linenos">106</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">cpu_pool</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="mixed_rank_graph-107"><a href="#mixed_rank_graph-107"><span class="linenos">107</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">BatchRankingSummary</span><span class="p">:</span>
+</span><span id="mixed_rank_graph-108"><a href="#mixed_rank_graph-108"><span class="linenos">108</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute the full mixed rank graph corresponding to all pairwise feature interactions based on the selected heuristic&quot;&quot;&quot;</span>
 </span><span id="mixed_rank_graph-109"><a href="#mixed_rank_graph-109"><span class="linenos">109</span></a>
-</span><span id="mixed_rank_graph-110"><a href="#mixed_rank_graph-110"><span class="linenos">110</span></a>    <span class="c1"># Handle cont. types prior to interaction evaluation</span>
-</span><span id="mixed_rank_graph-111"><a href="#mixed_rank_graph-111"><span class="linenos">111</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Encoding columns&#39;</span><span class="p">)</span>
-</span><span id="mixed_rank_graph-112"><a href="#mixed_rank_graph-112"><span class="linenos">112</span></a>    <span class="n">start_enc_timer</span> <span class="o">=</span> <span class="n">timer</span><span class="p">()</span>
-</span><span id="mixed_rank_graph-113"><a href="#mixed_rank_graph-113"><span class="linenos">113</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">({</span><span class="n">k</span> <span class="p">:</span> <span class="n">tmp_df</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">cat</span><span class="o">.</span><span class="n">codes</span> <span class="k">for</span> <span class="n">k</span> <span class="ow">in</span> <span class="n">all_columns</span><span class="p">})</span>
-</span><span id="mixed_rank_graph-114"><a href="#mixed_rank_graph-114"><span class="linenos">114</span></a>
-</span><span id="mixed_rank_graph-115"><a href="#mixed_rank_graph-115"><span class="linenos">115</span></a>    <span class="n">end_enc_timer</span> <span class="o">=</span> <span class="n">timer</span><span class="p">()</span>
-</span><span id="mixed_rank_graph-116"><a href="#mixed_rank_graph-116"><span class="linenos">116</span></a>    <span class="n">out_time_struct</span><span class="p">[</span><span class="s1">&#39;encoding_columns&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">end_enc_timer</span> <span class="o">-</span> <span class="n">start_enc_timer</span>
-</span><span id="mixed_rank_graph-117"><a href="#mixed_rank_graph-117"><span class="linenos">117</span></a>
-</span><span id="mixed_rank_graph-118"><a href="#mixed_rank_graph-118"><span class="linenos">118</span></a>    <span class="n">combinations</span> <span class="o">=</span> <span class="n">get_combinations_from_columns</span><span class="p">(</span><span class="n">all_columns</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="mixed_rank_graph-119"><a href="#mixed_rank_graph-119"><span class="linenos">119</span></a>    <span class="n">combinations</span> <span class="o">=</span> <span class="n">prior_combinations_sample</span><span class="p">(</span><span class="n">combinations</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="mixed_rank_graph-120"><a href="#mixed_rank_graph-120"><span class="linenos">120</span></a>    <span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">combinations</span><span class="p">)</span>
-</span><span id="mixed_rank_graph-121"><a href="#mixed_rank_graph-121"><span class="linenos">121</span></a>
-</span><span id="mixed_rank_graph-122"><a href="#mixed_rank_graph-122"><span class="linenos">122</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">==</span> <span class="s1">&#39;Constant&#39;</span><span class="p">:</span>
-</span><span id="mixed_rank_graph-123"><a href="#mixed_rank_graph-123"><span class="linenos">123</span></a>        <span class="n">final_constant_imp</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="mixed_rank_graph-124"><a href="#mixed_rank_graph-124"><span class="linenos">124</span></a>        <span class="k">for</span> <span class="n">c1</span><span class="p">,</span> <span class="n">c2</span> <span class="ow">in</span> <span class="n">combinations</span><span class="p">:</span>
-</span><span id="mixed_rank_graph-125"><a href="#mixed_rank_graph-125"><span class="linenos">125</span></a>            <span class="n">final_constant_imp</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">c1</span><span class="p">,</span> <span class="n">c2</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">))</span>
-</span><span id="mixed_rank_graph-126"><a href="#mixed_rank_graph-126"><span class="linenos">126</span></a>
-</span><span id="mixed_rank_graph-127"><a href="#mixed_rank_graph-127"><span class="linenos">127</span></a>        <span class="n">out_time_struct</span><span class="p">[</span><span class="s1">&#39;feature_score_computation&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">end_enc_timer</span> <span class="o">-</span> \
-</span><span id="mixed_rank_graph-128"><a href="#mixed_rank_graph-128"><span class="linenos">128</span></a>            <span class="n">start_enc_timer</span>
-</span><span id="mixed_rank_graph-129"><a href="#mixed_rank_graph-129"><span class="linenos">129</span></a>        <span class="k">return</span> <span class="n">BatchRankingSummary</span><span class="p">(</span><span class="n">final_constant_imp</span><span class="p">,</span> <span class="n">out_time_struct</span><span class="p">)</span>
+</span><span id="mixed_rank_graph-110"><a href="#mixed_rank_graph-110"><span class="linenos">110</span></a>    <span class="n">all_columns</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span>
+</span><span id="mixed_rank_graph-111"><a href="#mixed_rank_graph-111"><span class="linenos">111</span></a>
+</span><span id="mixed_rank_graph-112"><a href="#mixed_rank_graph-112"><span class="linenos">112</span></a>    <span class="n">triplets</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="mixed_rank_graph-113"><a href="#mixed_rank_graph-113"><span class="linenos">113</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="s1">&#39;category&#39;</span><span class="p">)</span>
+</span><span id="mixed_rank_graph-114"><a href="#mixed_rank_graph-114"><span class="linenos">114</span></a>    <span class="n">out_time_struct</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="mixed_rank_graph-115"><a href="#mixed_rank_graph-115"><span class="linenos">115</span></a>
+</span><span id="mixed_rank_graph-116"><a href="#mixed_rank_graph-116"><span class="linenos">116</span></a>    <span class="c1"># Handle cont. types prior to interaction evaluation</span>
+</span><span id="mixed_rank_graph-117"><a href="#mixed_rank_graph-117"><span class="linenos">117</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Encoding columns&#39;</span><span class="p">)</span>
+</span><span id="mixed_rank_graph-118"><a href="#mixed_rank_graph-118"><span class="linenos">118</span></a>    <span class="n">start_enc_timer</span> <span class="o">=</span> <span class="n">timer</span><span class="p">()</span>
+</span><span id="mixed_rank_graph-119"><a href="#mixed_rank_graph-119"><span class="linenos">119</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">({</span><span class="n">k</span> <span class="p">:</span> <span class="n">tmp_df</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">cat</span><span class="o">.</span><span class="n">codes</span> <span class="k">for</span> <span class="n">k</span> <span class="ow">in</span> <span class="n">all_columns</span><span class="p">})</span>
+</span><span id="mixed_rank_graph-120"><a href="#mixed_rank_graph-120"><span class="linenos">120</span></a>
+</span><span id="mixed_rank_graph-121"><a href="#mixed_rank_graph-121"><span class="linenos">121</span></a>    <span class="n">end_enc_timer</span> <span class="o">=</span> <span class="n">timer</span><span class="p">()</span>
+</span><span id="mixed_rank_graph-122"><a href="#mixed_rank_graph-122"><span class="linenos">122</span></a>    <span class="n">out_time_struct</span><span class="p">[</span><span class="s1">&#39;encoding_columns&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">end_enc_timer</span> <span class="o">-</span> <span class="n">start_enc_timer</span>
+</span><span id="mixed_rank_graph-123"><a href="#mixed_rank_graph-123"><span class="linenos">123</span></a>
+</span><span id="mixed_rank_graph-124"><a href="#mixed_rank_graph-124"><span class="linenos">124</span></a>    <span class="n">combinations</span> <span class="o">=</span> <span class="n">get_combinations_from_columns</span><span class="p">(</span><span class="n">all_columns</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="mixed_rank_graph-125"><a href="#mixed_rank_graph-125"><span class="linenos">125</span></a>
+</span><span id="mixed_rank_graph-126"><a href="#mixed_rank_graph-126"><span class="linenos">126</span></a>    <span class="n">reference_model_features</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="mixed_rank_graph-127"><a href="#mixed_rank_graph-127"><span class="linenos">127</span></a>    <span class="k">if</span> <span class="n">is_prior_heuristic</span><span class="p">(</span><span class="n">args</span><span class="p">):</span>
+</span><span id="mixed_rank_graph-128"><a href="#mixed_rank_graph-128"><span class="linenos">128</span></a>        <span class="n">reference_model_features</span> <span class="o">=</span> <span class="p">[(</span><span class="s1">&#39; AND &#39;</span><span class="p">)</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="nb">tuple</span><span class="p">(</span><span class="nb">sorted</span><span class="p">(</span><span class="n">item</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))))</span> <span class="k">for</span> <span class="n">item</span> <span class="ow">in</span> <span class="n">extract_features_from_reference_JSON</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span><span class="p">,</span> <span class="n">all_features</span><span class="o">=</span><span class="kc">True</span><span class="p">)]</span>
+</span><span id="mixed_rank_graph-129"><a href="#mixed_rank_graph-129"><span class="linenos">129</span></a>        <span class="n">combinations</span> <span class="o">=</span> <span class="p">[</span><span class="n">comb</span> <span class="k">for</span> <span class="n">comb</span> <span class="ow">in</span> <span class="n">combinations</span> <span class="k">if</span> <span class="n">comb</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">reference_model_features</span> <span class="ow">and</span> <span class="n">comb</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">reference_model_features</span><span class="p">]</span>
 </span><span id="mixed_rank_graph-130"><a href="#mixed_rank_graph-130"><span class="linenos">130</span></a>
-</span><span id="mixed_rank_graph-131"><a href="#mixed_rank_graph-131"><span class="linenos">131</span></a>    <span class="c1"># Map the scoring calls to the worker pool</span>
-</span><span id="mixed_rank_graph-132"><a href="#mixed_rank_graph-132"><span class="linenos">132</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Allocating thread pool&#39;</span><span class="p">)</span>
+</span><span id="mixed_rank_graph-131"><a href="#mixed_rank_graph-131"><span class="linenos">131</span></a>    <span class="n">combinations</span> <span class="o">=</span> <span class="n">prior_combinations_sample</span><span class="p">(</span><span class="n">combinations</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="mixed_rank_graph-132"><a href="#mixed_rank_graph-132"><span class="linenos">132</span></a>    <span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">combinations</span><span class="p">)</span>
 </span><span id="mixed_rank_graph-133"><a href="#mixed_rank_graph-133"><span class="linenos">133</span></a>
-</span><span id="mixed_rank_graph-134"><a href="#mixed_rank_graph-134"><span class="linenos">134</span></a>    <span class="c1"># starmap is an alternative that is slower unfortunately (but nicer)</span>
-</span><span id="mixed_rank_graph-135"><a href="#mixed_rank_graph-135"><span class="linenos">135</span></a>    <span class="k">def</span> <span class="nf">get_grounded_importances_estimate</span><span class="p">(</span><span class="n">combination</span><span class="p">:</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
-</span><span id="mixed_rank_graph-136"><a href="#mixed_rank_graph-136"><span class="linenos">136</span></a>        <span class="k">return</span> <span class="n">get_importances_estimate_pairwise</span><span class="p">(</span><span class="n">combination</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">tmp_df</span><span class="o">=</span><span class="n">tmp_df</span><span class="p">)</span>
-</span><span id="mixed_rank_graph-137"><a href="#mixed_rank_graph-137"><span class="linenos">137</span></a>
-</span><span id="mixed_rank_graph-138"><a href="#mixed_rank_graph-138"><span class="linenos">138</span></a>    <span class="n">start_enc_timer</span> <span class="o">=</span> <span class="n">timer</span><span class="p">()</span>
-</span><span id="mixed_rank_graph-139"><a href="#mixed_rank_graph-139"><span class="linenos">139</span></a>    <span class="k">with</span> <span class="n">cpu_pool</span> <span class="k">as</span> <span class="n">p</span><span class="p">:</span>
-</span><span id="mixed_rank_graph-140"><a href="#mixed_rank_graph-140"><span class="linenos">140</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Computing (#ftr=</span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">combinations</span><span class="p">)</span><span class="si">}</span><span class="s1">)&#39;</span><span class="p">)</span>
-</span><span id="mixed_rank_graph-141"><a href="#mixed_rank_graph-141"><span class="linenos">141</span></a>        <span class="n">results</span> <span class="o">=</span> <span class="n">p</span><span class="o">.</span><span class="n">amap</span><span class="p">(</span><span class="n">get_grounded_importances_estimate</span><span class="p">,</span> <span class="n">combinations</span><span class="p">)</span>
-</span><span id="mixed_rank_graph-142"><a href="#mixed_rank_graph-142"><span class="linenos">142</span></a>        <span class="k">while</span> <span class="ow">not</span> <span class="n">results</span><span class="o">.</span><span class="n">ready</span><span class="p">():</span>
-</span><span id="mixed_rank_graph-143"><a href="#mixed_rank_graph-143"><span class="linenos">143</span></a>            <span class="n">time</span><span class="o">.</span><span class="n">sleep</span><span class="p">(</span><span class="mi">4</span><span class="p">)</span>
-</span><span id="mixed_rank_graph-144"><a href="#mixed_rank_graph-144"><span class="linenos">144</span></a>        <span class="n">triplets</span> <span class="o">=</span> <span class="n">results</span><span class="o">.</span><span class="n">get</span><span class="p">()</span>
-</span><span id="mixed_rank_graph-145"><a href="#mixed_rank_graph-145"><span class="linenos">145</span></a>    <span class="n">end_enc_timer</span> <span class="o">=</span> <span class="n">timer</span><span class="p">()</span>
-</span><span id="mixed_rank_graph-146"><a href="#mixed_rank_graph-146"><span class="linenos">146</span></a>    <span class="n">out_time_struct</span><span class="p">[</span><span class="s1">&#39;feature_score_computation&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">end_enc_timer</span> <span class="o">-</span> \
-</span><span id="mixed_rank_graph-147"><a href="#mixed_rank_graph-147"><span class="linenos">147</span></a>        <span class="n">start_enc_timer</span>
-</span><span id="mixed_rank_graph-148"><a href="#mixed_rank_graph-148"><span class="linenos">148</span></a>
-</span><span id="mixed_rank_graph-149"><a href="#mixed_rank_graph-149"><span class="linenos">149</span></a>    <span class="c1"># Gather the final triplets</span>
-</span><span id="mixed_rank_graph-150"><a href="#mixed_rank_graph-150"><span class="linenos">150</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Aggregation of ranking results&#39;</span><span class="p">)</span>
-</span><span id="mixed_rank_graph-151"><a href="#mixed_rank_graph-151"><span class="linenos">151</span></a>    <span class="n">final_triplets</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="mixed_rank_graph-152"><a href="#mixed_rank_graph-152"><span class="linenos">152</span></a>    <span class="k">for</span> <span class="n">triplet</span> <span class="ow">in</span> <span class="n">triplets</span><span class="p">:</span>
-</span><span id="mixed_rank_graph-153"><a href="#mixed_rank_graph-153"><span class="linenos">153</span></a>        <span class="n">inv</span> <span class="o">=</span> <span class="p">(</span><span class="n">triplet</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">triplet</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">triplet</span><span class="p">[</span><span class="mi">2</span><span class="p">])</span>
-</span><span id="mixed_rank_graph-154"><a href="#mixed_rank_graph-154"><span class="linenos">154</span></a>        <span class="n">final_triplets</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">inv</span><span class="p">)</span>
-</span><span id="mixed_rank_graph-155"><a href="#mixed_rank_graph-155"><span class="linenos">155</span></a>        <span class="n">final_triplets</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">triplet</span><span class="p">)</span>
-</span><span id="mixed_rank_graph-156"><a href="#mixed_rank_graph-156"><span class="linenos">156</span></a>        <span class="n">triplets</span> <span class="o">=</span> <span class="n">final_triplets</span>
-</span><span id="mixed_rank_graph-157"><a href="#mixed_rank_graph-157"><span class="linenos">157</span></a>
-</span><span id="mixed_rank_graph-158"><a href="#mixed_rank_graph-158"><span class="linenos">158</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Proceeding to the next batch of data&#39;</span><span class="p">)</span>
-</span><span id="mixed_rank_graph-159"><a href="#mixed_rank_graph-159"><span class="linenos">159</span></a>    <span class="k">return</span> <span class="n">BatchRankingSummary</span><span class="p">(</span><span class="n">triplets</span><span class="p">,</span> <span class="n">out_time_struct</span><span class="p">)</span>
+</span><span id="mixed_rank_graph-134"><a href="#mixed_rank_graph-134"><span class="linenos">134</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">==</span> <span class="s1">&#39;Constant&#39;</span><span class="p">:</span>
+</span><span id="mixed_rank_graph-135"><a href="#mixed_rank_graph-135"><span class="linenos">135</span></a>        <span class="n">final_constant_imp</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="mixed_rank_graph-136"><a href="#mixed_rank_graph-136"><span class="linenos">136</span></a>        <span class="k">for</span> <span class="n">c1</span><span class="p">,</span> <span class="n">c2</span> <span class="ow">in</span> <span class="n">combinations</span><span class="p">:</span>
+</span><span id="mixed_rank_graph-137"><a href="#mixed_rank_graph-137"><span class="linenos">137</span></a>            <span class="n">final_constant_imp</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">c1</span><span class="p">,</span> <span class="n">c2</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">))</span>
+</span><span id="mixed_rank_graph-138"><a href="#mixed_rank_graph-138"><span class="linenos">138</span></a>
+</span><span id="mixed_rank_graph-139"><a href="#mixed_rank_graph-139"><span class="linenos">139</span></a>        <span class="n">out_time_struct</span><span class="p">[</span><span class="s1">&#39;feature_score_computation&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">end_enc_timer</span> <span class="o">-</span> \
+</span><span id="mixed_rank_graph-140"><a href="#mixed_rank_graph-140"><span class="linenos">140</span></a>            <span class="n">start_enc_timer</span>
+</span><span id="mixed_rank_graph-141"><a href="#mixed_rank_graph-141"><span class="linenos">141</span></a>        <span class="k">return</span> <span class="n">BatchRankingSummary</span><span class="p">(</span><span class="n">final_constant_imp</span><span class="p">,</span> <span class="n">out_time_struct</span><span class="p">)</span>
+</span><span id="mixed_rank_graph-142"><a href="#mixed_rank_graph-142"><span class="linenos">142</span></a>
+</span><span id="mixed_rank_graph-143"><a href="#mixed_rank_graph-143"><span class="linenos">143</span></a>    <span class="c1"># Map the scoring calls to the worker pool</span>
+</span><span id="mixed_rank_graph-144"><a href="#mixed_rank_graph-144"><span class="linenos">144</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Allocating thread pool&#39;</span><span class="p">)</span>
+</span><span id="mixed_rank_graph-145"><a href="#mixed_rank_graph-145"><span class="linenos">145</span></a>
+</span><span id="mixed_rank_graph-146"><a href="#mixed_rank_graph-146"><span class="linenos">146</span></a>    <span class="c1"># starmap is an alternative that is slower unfortunately (but nicer)</span>
+</span><span id="mixed_rank_graph-147"><a href="#mixed_rank_graph-147"><span class="linenos">147</span></a>    <span class="k">def</span> <span class="nf">get_grounded_importances_estimate</span><span class="p">(</span><span class="n">combination</span><span class="p">:</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
+</span><span id="mixed_rank_graph-148"><a href="#mixed_rank_graph-148"><span class="linenos">148</span></a>        <span class="k">return</span> <span class="n">get_importances_estimate_pairwise</span><span class="p">(</span><span class="n">combination</span><span class="p">,</span> <span class="n">reference_model_features</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">tmp_df</span><span class="o">=</span><span class="n">tmp_df</span><span class="p">)</span>
+</span><span id="mixed_rank_graph-149"><a href="#mixed_rank_graph-149"><span class="linenos">149</span></a>
+</span><span id="mixed_rank_graph-150"><a href="#mixed_rank_graph-150"><span class="linenos">150</span></a>    <span class="n">start_enc_timer</span> <span class="o">=</span> <span class="n">timer</span><span class="p">()</span>
+</span><span id="mixed_rank_graph-151"><a href="#mixed_rank_graph-151"><span class="linenos">151</span></a>    <span class="k">with</span> <span class="n">cpu_pool</span> <span class="k">as</span> <span class="n">p</span><span class="p">:</span>
+</span><span id="mixed_rank_graph-152"><a href="#mixed_rank_graph-152"><span class="linenos">152</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Computing (#ftr=</span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">combinations</span><span class="p">)</span><span class="si">}</span><span class="s1">)&#39;</span><span class="p">)</span>
+</span><span id="mixed_rank_graph-153"><a href="#mixed_rank_graph-153"><span class="linenos">153</span></a>        <span class="n">results</span> <span class="o">=</span> <span class="n">p</span><span class="o">.</span><span class="n">amap</span><span class="p">(</span><span class="n">get_grounded_importances_estimate</span><span class="p">,</span> <span class="n">combinations</span><span class="p">)</span>
+</span><span id="mixed_rank_graph-154"><a href="#mixed_rank_graph-154"><span class="linenos">154</span></a>        <span class="k">while</span> <span class="ow">not</span> <span class="n">results</span><span class="o">.</span><span class="n">ready</span><span class="p">():</span>
+</span><span id="mixed_rank_graph-155"><a href="#mixed_rank_graph-155"><span class="linenos">155</span></a>            <span class="n">time</span><span class="o">.</span><span class="n">sleep</span><span class="p">(</span><span class="mi">4</span><span class="p">)</span>
+</span><span id="mixed_rank_graph-156"><a href="#mixed_rank_graph-156"><span class="linenos">156</span></a>        <span class="n">triplets</span> <span class="o">=</span> <span class="n">results</span><span class="o">.</span><span class="n">get</span><span class="p">()</span>
+</span><span id="mixed_rank_graph-157"><a href="#mixed_rank_graph-157"><span class="linenos">157</span></a>    <span class="n">end_enc_timer</span> <span class="o">=</span> <span class="n">timer</span><span class="p">()</span>
+</span><span id="mixed_rank_graph-158"><a href="#mixed_rank_graph-158"><span class="linenos">158</span></a>    <span class="n">out_time_struct</span><span class="p">[</span><span class="s1">&#39;feature_score_computation&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">end_enc_timer</span> <span class="o">-</span> \
+</span><span id="mixed_rank_graph-159"><a href="#mixed_rank_graph-159"><span class="linenos">159</span></a>        <span class="n">start_enc_timer</span>
+</span><span id="mixed_rank_graph-160"><a href="#mixed_rank_graph-160"><span class="linenos">160</span></a>
+</span><span id="mixed_rank_graph-161"><a href="#mixed_rank_graph-161"><span class="linenos">161</span></a>    <span class="c1"># Gather the final triplets</span>
+</span><span id="mixed_rank_graph-162"><a href="#mixed_rank_graph-162"><span class="linenos">162</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Aggregation of ranking results&#39;</span><span class="p">)</span>
+</span><span id="mixed_rank_graph-163"><a href="#mixed_rank_graph-163"><span class="linenos">163</span></a>    <span class="n">final_triplets</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="mixed_rank_graph-164"><a href="#mixed_rank_graph-164"><span class="linenos">164</span></a>    <span class="k">for</span> <span class="n">triplet</span> <span class="ow">in</span> <span class="n">triplets</span><span class="p">:</span>
+</span><span id="mixed_rank_graph-165"><a href="#mixed_rank_graph-165"><span class="linenos">165</span></a>        <span class="n">inv</span> <span class="o">=</span> <span class="p">(</span><span class="n">triplet</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">triplet</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">triplet</span><span class="p">[</span><span class="mi">2</span><span class="p">])</span>
+</span><span id="mixed_rank_graph-166"><a href="#mixed_rank_graph-166"><span class="linenos">166</span></a>        <span class="n">final_triplets</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">inv</span><span class="p">)</span>
+</span><span id="mixed_rank_graph-167"><a href="#mixed_rank_graph-167"><span class="linenos">167</span></a>        <span class="n">final_triplets</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">triplet</span><span class="p">)</span>
+</span><span id="mixed_rank_graph-168"><a href="#mixed_rank_graph-168"><span class="linenos">168</span></a>        <span class="n">triplets</span> <span class="o">=</span> <span class="n">final_triplets</span>
+</span><span id="mixed_rank_graph-169"><a href="#mixed_rank_graph-169"><span class="linenos">169</span></a>
+</span><span id="mixed_rank_graph-170"><a href="#mixed_rank_graph-170"><span class="linenos">170</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Proceeding to the next batch of data&#39;</span><span class="p">)</span>
+</span><span id="mixed_rank_graph-171"><a href="#mixed_rank_graph-171"><span class="linenos">171</span></a>    <span class="k">return</span> <span class="n">BatchRankingSummary</span><span class="p">(</span><span class="n">triplets</span><span class="p">,</span> <span class="n">out_time_struct</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -1149,7 +1157,7 @@ <h1 class="modulename">
                 <section id="enrich_with_transformations">
                             <input id="enrich_with_transformations-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">enrich_with_transformations</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>,</span><span class="param">	<span class="n">num_col_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span>,</span><span class="param">	<span class="n">logger</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">args</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>:</span></span>
 
@@ -1157,20 +1165,20 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#enrich_with_transformations"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="enrich_with_transformations-162"><a href="#enrich_with_transformations-162"><span class="linenos">162</span></a><span class="k">def</span> <span class="nf">enrich_with_transformations</span><span class="p">(</span>
-</span><span id="enrich_with_transformations-163"><a href="#enrich_with_transformations-163"><span class="linenos">163</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">num_col_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="enrich_with_transformations-164"><a href="#enrich_with_transformations-164"><span class="linenos">164</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="enrich_with_transformations-165"><a href="#enrich_with_transformations-165"><span class="linenos">165</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Construct a collection of new features based on pre-defined transformations/rules&quot;&quot;&quot;</span>
-</span><span id="enrich_with_transformations-166"><a href="#enrich_with_transformations-166"><span class="linenos">166</span></a>
-</span><span id="enrich_with_transformations-167"><a href="#enrich_with_transformations-167"><span class="linenos">167</span></a>    <span class="n">transformer</span> <span class="o">=</span> <span class="n">FeatureTransformerGeneric</span><span class="p">(</span>
-</span><span id="enrich_with_transformations-168"><a href="#enrich_with_transformations-168"><span class="linenos">168</span></a>        <span class="n">num_col_types</span><span class="p">,</span> <span class="n">preset</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">transformers</span><span class="p">,</span>
-</span><span id="enrich_with_transformations-169"><a href="#enrich_with_transformations-169"><span class="linenos">169</span></a>    <span class="p">)</span>
-</span><span id="enrich_with_transformations-170"><a href="#enrich_with_transformations-170"><span class="linenos">170</span></a>    <span class="n">transformed_df</span> <span class="o">=</span> <span class="n">transformer</span><span class="o">.</span><span class="n">construct_new_features</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">)</span>
-</span><span id="enrich_with_transformations-171"><a href="#enrich_with_transformations-171"><span class="linenos">171</span></a>    <span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="enrich_with_transformations-172"><a href="#enrich_with_transformations-172"><span class="linenos">172</span></a>        <span class="sa">f</span><span class="s1">&#39;Constructed </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">transformer</span><span class="o">.</span><span class="n">constructed_feature_names</span><span class="p">)</span><span class="si">}</span><span class="s1"> new features ..&#39;</span><span class="p">,</span>
-</span><span id="enrich_with_transformations-173"><a href="#enrich_with_transformations-173"><span class="linenos">173</span></a>    <span class="p">)</span>
-</span><span id="enrich_with_transformations-174"><a href="#enrich_with_transformations-174"><span class="linenos">174</span></a>
-</span><span id="enrich_with_transformations-175"><a href="#enrich_with_transformations-175"><span class="linenos">175</span></a>    <span class="k">return</span> <span class="n">transformed_df</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="enrich_with_transformations-174"><a href="#enrich_with_transformations-174"><span class="linenos">174</span></a><span class="k">def</span> <span class="nf">enrich_with_transformations</span><span class="p">(</span>
+</span><span id="enrich_with_transformations-175"><a href="#enrich_with_transformations-175"><span class="linenos">175</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">num_col_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="enrich_with_transformations-176"><a href="#enrich_with_transformations-176"><span class="linenos">176</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="enrich_with_transformations-177"><a href="#enrich_with_transformations-177"><span class="linenos">177</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Construct a collection of new features based on pre-defined transformations/rules&quot;&quot;&quot;</span>
+</span><span id="enrich_with_transformations-178"><a href="#enrich_with_transformations-178"><span class="linenos">178</span></a>
+</span><span id="enrich_with_transformations-179"><a href="#enrich_with_transformations-179"><span class="linenos">179</span></a>    <span class="n">transformer</span> <span class="o">=</span> <span class="n">FeatureTransformerGeneric</span><span class="p">(</span>
+</span><span id="enrich_with_transformations-180"><a href="#enrich_with_transformations-180"><span class="linenos">180</span></a>        <span class="n">num_col_types</span><span class="p">,</span> <span class="n">preset</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">transformers</span><span class="p">,</span>
+</span><span id="enrich_with_transformations-181"><a href="#enrich_with_transformations-181"><span class="linenos">181</span></a>    <span class="p">)</span>
+</span><span id="enrich_with_transformations-182"><a href="#enrich_with_transformations-182"><span class="linenos">182</span></a>    <span class="n">transformed_df</span> <span class="o">=</span> <span class="n">transformer</span><span class="o">.</span><span class="n">construct_new_features</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">)</span>
+</span><span id="enrich_with_transformations-183"><a href="#enrich_with_transformations-183"><span class="linenos">183</span></a>    <span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="enrich_with_transformations-184"><a href="#enrich_with_transformations-184"><span class="linenos">184</span></a>        <span class="sa">f</span><span class="s1">&#39;Constructed </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">transformer</span><span class="o">.</span><span class="n">constructed_feature_names</span><span class="p">)</span><span class="si">}</span><span class="s1"> new features ..&#39;</span><span class="p">,</span>
+</span><span id="enrich_with_transformations-185"><a href="#enrich_with_transformations-185"><span class="linenos">185</span></a>    <span class="p">)</span>
+</span><span id="enrich_with_transformations-186"><a href="#enrich_with_transformations-186"><span class="linenos">186</span></a>
+</span><span id="enrich_with_transformations-187"><a href="#enrich_with_transformations-187"><span class="linenos">187</span></a>    <span class="k">return</span> <span class="n">transformed_df</span>
 </span></pre></div>
 
 
@@ -1182,67 +1190,72 @@ <h1 class="modulename">
                 <section id="compute_combined_features">
                             <input id="compute_combined_features-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
-        <span class="name">compute_combined_features</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>,</span><span class="param">	<span class="n">logger</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">args</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">is_3mr</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span></span><span class="return-annotation">) -> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>:</span></span>
+        <span class="name">compute_combined_features</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>,</span><span class="param">	<span class="n">args</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">is_3mr</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span></span><span class="return-annotation">) -> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>:</span></span>
 
                 <label class="view-source-button" for="compute_combined_features-view-source"><span>View Source</span></label>
 
     </div>
     <a class="headerlink" href="#compute_combined_features"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_combined_features-178"><a href="#compute_combined_features-178"><span class="linenos">178</span></a><span class="k">def</span> <span class="nf">compute_combined_features</span><span class="p">(</span>
-</span><span id="compute_combined_features-179"><a href="#compute_combined_features-179"><span class="linenos">179</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span>
-</span><span id="compute_combined_features-180"><a href="#compute_combined_features-180"><span class="linenos">180</span></a>    <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="compute_combined_features-181"><a href="#compute_combined_features-181"><span class="linenos">181</span></a>    <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="compute_combined_features-182"><a href="#compute_combined_features-182"><span class="linenos">182</span></a>    <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="compute_combined_features-183"><a href="#compute_combined_features-183"><span class="linenos">183</span></a>    <span class="n">is_3mr</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="compute_combined_features-184"><a href="#compute_combined_features-184"><span class="linenos">184</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="compute_combined_features-185"><a href="#compute_combined_features-185"><span class="linenos">185</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute higher order features via xxhash-based trick.&quot;&quot;&quot;</span>
-</span><span id="compute_combined_features-186"><a href="#compute_combined_features-186"><span class="linenos">186</span></a>
-</span><span id="compute_combined_features-187"><a href="#compute_combined_features-187"><span class="linenos">187</span></a>    <span class="n">all_columns</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="compute_combined_features-188"><a href="#compute_combined_features-188"><span class="linenos">188</span></a>        <span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span> <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span>
-</span><span id="compute_combined_features-189"><a href="#compute_combined_features-189"><span class="linenos">189</span></a>    <span class="p">]</span>
-</span><span id="compute_combined_features-190"><a href="#compute_combined_features-190"><span class="linenos">190</span></a>    <span class="n">join_string</span> <span class="o">=</span> <span class="s1">&#39; AND_REL &#39;</span> <span class="k">if</span> <span class="n">is_3mr</span> <span class="k">else</span> <span class="s1">&#39; AND &#39;</span>
-</span><span id="compute_combined_features-191"><a href="#compute_combined_features-191"><span class="linenos">191</span></a>    <span class="n">interaction_order</span> <span class="o">=</span> <span class="mi">2</span> <span class="k">if</span> <span class="n">is_3mr</span> <span class="k">else</span> <span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span>
-</span><span id="compute_combined_features-192"><a href="#compute_combined_features-192"><span class="linenos">192</span></a>
-</span><span id="compute_combined_features-193"><a href="#compute_combined_features-193"><span class="linenos">193</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span> <span class="o">!=</span> <span class="s1">&#39;&#39;</span><span class="p">:</span>
-</span><span id="compute_combined_features-194"><a href="#compute_combined_features-194"><span class="linenos">194</span></a>        <span class="n">combined_features</span> <span class="o">=</span> <span class="n">extract_features_from_reference_JSON</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span><span class="p">,</span> <span class="n">combined_features_only</span> <span class="o">=</span> <span class="kc">True</span><span class="p">)</span>
-</span><span id="compute_combined_features-195"><a href="#compute_combined_features-195"><span class="linenos">195</span></a>        <span class="n">full_combination_space</span> <span class="o">=</span> <span class="p">[</span><span class="n">combination</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">)</span> <span class="k">for</span> <span class="n">combination</span> <span class="ow">in</span> <span class="n">combined_features</span><span class="p">]</span>
-</span><span id="compute_combined_features-196"><a href="#compute_combined_features-196"><span class="linenos">196</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="compute_combined_features-197"><a href="#compute_combined_features-197"><span class="linenos">197</span></a>        <span class="n">full_combination_space</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span>
-</span><span id="compute_combined_features-198"><a href="#compute_combined_features-198"><span class="linenos">198</span></a>            <span class="n">itertools</span><span class="o">.</span><span class="n">combinations</span><span class="p">(</span><span class="n">all_columns</span><span class="p">,</span> <span class="n">interaction_order</span><span class="p">),</span>
-</span><span id="compute_combined_features-199"><a href="#compute_combined_features-199"><span class="linenos">199</span></a>        <span class="p">)</span>
-</span><span id="compute_combined_features-200"><a href="#compute_combined_features-200"><span class="linenos">200</span></a>
-</span><span id="compute_combined_features-201"><a href="#compute_combined_features-201"><span class="linenos">201</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span> <span class="o">!=</span> <span class="s1">&#39;&#39;</span><span class="p">:</span>
-</span><span id="compute_combined_features-202"><a href="#compute_combined_features-202"><span class="linenos">202</span></a>        <span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">full_combination_space</span><span class="p">)</span>
-</span><span id="compute_combined_features-203"><a href="#compute_combined_features-203"><span class="linenos">203</span></a>        <span class="n">full_combination_space</span> <span class="o">=</span> <span class="n">full_combination_space</span><span class="p">[</span>
-</span><span id="compute_combined_features-204"><a href="#compute_combined_features-204"><span class="linenos">204</span></a>            <span class="p">:</span> <span class="n">args</span><span class="o">.</span><span class="n">combination_number_upper_bound</span>
-</span><span id="compute_combined_features-205"><a href="#compute_combined_features-205"><span class="linenos">205</span></a>        <span class="p">]</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_combined_features-190"><a href="#compute_combined_features-190"><span class="linenos">190</span></a><span class="k">def</span> <span class="nf">compute_combined_features</span><span class="p">(</span>
+</span><span id="compute_combined_features-191"><a href="#compute_combined_features-191"><span class="linenos">191</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span>
+</span><span id="compute_combined_features-192"><a href="#compute_combined_features-192"><span class="linenos">192</span></a>    <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="compute_combined_features-193"><a href="#compute_combined_features-193"><span class="linenos">193</span></a>    <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="compute_combined_features-194"><a href="#compute_combined_features-194"><span class="linenos">194</span></a>    <span class="n">is_3mr</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="compute_combined_features-195"><a href="#compute_combined_features-195"><span class="linenos">195</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="compute_combined_features-196"><a href="#compute_combined_features-196"><span class="linenos">196</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute higher order features via xxhash-based trick.&quot;&quot;&quot;</span>
+</span><span id="compute_combined_features-197"><a href="#compute_combined_features-197"><span class="linenos">197</span></a>
+</span><span id="compute_combined_features-198"><a href="#compute_combined_features-198"><span class="linenos">198</span></a>    <span class="n">all_columns</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="compute_combined_features-199"><a href="#compute_combined_features-199"><span class="linenos">199</span></a>        <span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span> <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span>
+</span><span id="compute_combined_features-200"><a href="#compute_combined_features-200"><span class="linenos">200</span></a>    <span class="p">]</span>
+</span><span id="compute_combined_features-201"><a href="#compute_combined_features-201"><span class="linenos">201</span></a>    <span class="n">join_string</span> <span class="o">=</span> <span class="s1">&#39; AND_REL &#39;</span> <span class="k">if</span> <span class="n">is_3mr</span> <span class="k">else</span> <span class="s1">&#39; AND &#39;</span>
+</span><span id="compute_combined_features-202"><a href="#compute_combined_features-202"><span class="linenos">202</span></a>    <span class="n">interaction_order</span> <span class="o">=</span> <span class="mi">2</span> <span class="k">if</span> <span class="n">is_3mr</span> <span class="k">else</span> <span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span>
+</span><span id="compute_combined_features-203"><a href="#compute_combined_features-203"><span class="linenos">203</span></a>
+</span><span id="compute_combined_features-204"><a href="#compute_combined_features-204"><span class="linenos">204</span></a>    <span class="n">model_combinations</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="compute_combined_features-205"><a href="#compute_combined_features-205"><span class="linenos">205</span></a>    <span class="n">full_combination_space</span> <span class="o">=</span> <span class="p">[]</span>
 </span><span id="compute_combined_features-206"><a href="#compute_combined_features-206"><span class="linenos">206</span></a>
-</span><span id="compute_combined_features-207"><a href="#compute_combined_features-207"><span class="linenos">207</span></a>    <span class="n">com_counter</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="compute_combined_features-208"><a href="#compute_combined_features-208"><span class="linenos">208</span></a>    <span class="n">new_feature_hash</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="compute_combined_features-209"><a href="#compute_combined_features-209"><span class="linenos">209</span></a>    <span class="k">for</span> <span class="n">new_combination</span> <span class="ow">in</span> <span class="n">full_combination_space</span><span class="p">:</span>
-</span><span id="compute_combined_features-210"><a href="#compute_combined_features-210"><span class="linenos">210</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span>
-</span><span id="compute_combined_features-211"><a href="#compute_combined_features-211"><span class="linenos">211</span></a>            <span class="sa">f</span><span class="s1">&#39;Created </span><span class="si">{</span><span class="n">com_counter</span><span class="si">}</span><span class="s1">/</span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">full_combination_space</span><span class="p">)</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="compute_combined_features-212"><a href="#compute_combined_features-212"><span class="linenos">212</span></a>        <span class="p">)</span>
-</span><span id="compute_combined_features-213"><a href="#compute_combined_features-213"><span class="linenos">213</span></a>        <span class="n">combined_feature</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="nb">str</span><span class="p">(</span><span class="mi">0</span><span class="p">)]</span> <span class="o">*</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="compute_combined_features-214"><a href="#compute_combined_features-214"><span class="linenos">214</span></a>        <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">new_combination</span><span class="p">:</span>
-</span><span id="compute_combined_features-215"><a href="#compute_combined_features-215"><span class="linenos">215</span></a>            <span class="n">tmp_feature</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">feature</span><span class="p">]</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="compute_combined_features-216"><a href="#compute_combined_features-216"><span class="linenos">216</span></a>            <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">el</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">tmp_feature</span><span class="p">):</span>
-</span><span id="compute_combined_features-217"><a href="#compute_combined_features-217"><span class="linenos">217</span></a>                <span class="n">combined_feature</span><span class="p">[</span><span class="n">enx</span><span class="p">]</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span>
-</span><span id="compute_combined_features-218"><a href="#compute_combined_features-218"><span class="linenos">218</span></a>                    <span class="n">internal_hash</span><span class="p">(</span>
-</span><span id="compute_combined_features-219"><a href="#compute_combined_features-219"><span class="linenos">219</span></a>                        <span class="nb">str</span><span class="p">(</span><span class="n">combined_feature</span><span class="p">[</span><span class="n">enx</span><span class="p">])</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="n">el</span><span class="p">),</span>
-</span><span id="compute_combined_features-220"><a href="#compute_combined_features-220"><span class="linenos">220</span></a>                    <span class="p">),</span>
-</span><span id="compute_combined_features-221"><a href="#compute_combined_features-221"><span class="linenos">221</span></a>                <span class="p">)</span>
-</span><span id="compute_combined_features-222"><a href="#compute_combined_features-222"><span class="linenos">222</span></a>        <span class="n">ftr_name</span> <span class="o">=</span> <span class="n">join_string</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">new_combination</span><span class="p">)</span>
-</span><span id="compute_combined_features-223"><a href="#compute_combined_features-223"><span class="linenos">223</span></a>        <span class="n">new_feature_hash</span><span class="p">[</span><span class="n">ftr_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">combined_feature</span>
-</span><span id="compute_combined_features-224"><a href="#compute_combined_features-224"><span class="linenos">224</span></a>        <span class="n">com_counter</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="compute_combined_features-225"><a href="#compute_combined_features-225"><span class="linenos">225</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">new_feature_hash</span><span class="p">)</span>
-</span><span id="compute_combined_features-226"><a href="#compute_combined_features-226"><span class="linenos">226</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Concatenating into final frame ..&#39;</span><span class="p">)</span>
-</span><span id="compute_combined_features-227"><a href="#compute_combined_features-227"><span class="linenos">227</span></a>    <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">([</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="compute_combined_features-228"><a href="#compute_combined_features-228"><span class="linenos">228</span></a>    <span class="k">del</span> <span class="n">tmp_df</span>
-</span><span id="compute_combined_features-229"><a href="#compute_combined_features-229"><span class="linenos">229</span></a>
-</span><span id="compute_combined_features-230"><a href="#compute_combined_features-230"><span class="linenos">230</span></a>    <span class="k">return</span> <span class="n">input_dataframe</span>
+</span><span id="compute_combined_features-207"><a href="#compute_combined_features-207"><span class="linenos">207</span></a>
+</span><span id="compute_combined_features-208"><a href="#compute_combined_features-208"><span class="linenos">208</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="compute_combined_features-209"><a href="#compute_combined_features-209"><span class="linenos">209</span></a>            <span class="n">full_combination_space</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span>
+</span><span id="compute_combined_features-210"><a href="#compute_combined_features-210"><span class="linenos">210</span></a>                <span class="n">itertools</span><span class="o">.</span><span class="n">combinations</span><span class="p">(</span><span class="n">all_columns</span><span class="p">,</span> <span class="n">interaction_order</span><span class="p">),</span>
+</span><span id="compute_combined_features-211"><a href="#compute_combined_features-211"><span class="linenos">211</span></a>            <span class="p">)</span>
+</span><span id="compute_combined_features-212"><a href="#compute_combined_features-212"><span class="linenos">212</span></a>    <span class="n">full_combination_space</span> <span class="o">=</span> <span class="n">prior_combinations_sample</span><span class="p">(</span><span class="n">full_combination_space</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="compute_combined_features-213"><a href="#compute_combined_features-213"><span class="linenos">213</span></a>
+</span><span id="compute_combined_features-214"><a href="#compute_combined_features-214"><span class="linenos">214</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span> <span class="o">!=</span> <span class="s1">&#39;&#39;</span><span class="p">:</span>
+</span><span id="compute_combined_features-215"><a href="#compute_combined_features-215"><span class="linenos">215</span></a>        <span class="n">model_combinations</span> <span class="o">=</span> <span class="n">extract_features_from_reference_JSON</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span><span class="p">,</span> <span class="n">combined_features_only</span> <span class="o">=</span> <span class="kc">True</span><span class="p">)</span>
+</span><span id="compute_combined_features-216"><a href="#compute_combined_features-216"><span class="linenos">216</span></a>        <span class="n">model_combinations</span> <span class="o">=</span> <span class="p">[</span><span class="nb">tuple</span><span class="p">(</span><span class="nb">sorted</span><span class="p">(</span><span class="n">combination</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">)))</span> <span class="k">for</span> <span class="n">combination</span> <span class="ow">in</span> <span class="n">model_combinations</span><span class="p">]</span>
+</span><span id="compute_combined_features-217"><a href="#compute_combined_features-217"><span class="linenos">217</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">is_prior_heuristic</span><span class="p">(</span><span class="n">args</span><span class="p">):</span>
+</span><span id="compute_combined_features-218"><a href="#compute_combined_features-218"><span class="linenos">218</span></a>            <span class="n">full_combination_space</span> <span class="o">=</span> <span class="n">model_combinations</span>
+</span><span id="compute_combined_features-219"><a href="#compute_combined_features-219"><span class="linenos">219</span></a>
+</span><span id="compute_combined_features-220"><a href="#compute_combined_features-220"><span class="linenos">220</span></a>    <span class="k">if</span> <span class="n">is_prior_heuristic</span><span class="p">(</span><span class="n">args</span><span class="p">):</span>
+</span><span id="compute_combined_features-221"><a href="#compute_combined_features-221"><span class="linenos">221</span></a>        <span class="n">full_combination_space</span> <span class="o">=</span> <span class="n">full_combination_space</span> <span class="o">+</span> <span class="p">[</span><span class="nb">tuple</span> <span class="k">for</span> <span class="nb">tuple</span> <span class="ow">in</span> <span class="n">model_combinations</span> <span class="k">if</span> <span class="nb">tuple</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">full_combination_space</span><span class="p">]</span>
+</span><span id="compute_combined_features-222"><a href="#compute_combined_features-222"><span class="linenos">222</span></a>
+</span><span id="compute_combined_features-223"><a href="#compute_combined_features-223"><span class="linenos">223</span></a>
+</span><span id="compute_combined_features-224"><a href="#compute_combined_features-224"><span class="linenos">224</span></a>    <span class="n">com_counter</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="compute_combined_features-225"><a href="#compute_combined_features-225"><span class="linenos">225</span></a>    <span class="n">new_feature_hash</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="compute_combined_features-226"><a href="#compute_combined_features-226"><span class="linenos">226</span></a>    <span class="k">for</span> <span class="n">new_combination</span> <span class="ow">in</span> <span class="n">full_combination_space</span><span class="p">:</span>
+</span><span id="compute_combined_features-227"><a href="#compute_combined_features-227"><span class="linenos">227</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span>
+</span><span id="compute_combined_features-228"><a href="#compute_combined_features-228"><span class="linenos">228</span></a>            <span class="sa">f</span><span class="s1">&#39;Created </span><span class="si">{</span><span class="n">com_counter</span><span class="si">}</span><span class="s1">/</span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">full_combination_space</span><span class="p">)</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="compute_combined_features-229"><a href="#compute_combined_features-229"><span class="linenos">229</span></a>        <span class="p">)</span>
+</span><span id="compute_combined_features-230"><a href="#compute_combined_features-230"><span class="linenos">230</span></a>        <span class="n">combined_feature</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="nb">str</span><span class="p">(</span><span class="mi">0</span><span class="p">)]</span> <span class="o">*</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="compute_combined_features-231"><a href="#compute_combined_features-231"><span class="linenos">231</span></a>        <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">new_combination</span><span class="p">:</span>
+</span><span id="compute_combined_features-232"><a href="#compute_combined_features-232"><span class="linenos">232</span></a>            <span class="n">tmp_feature</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">feature</span><span class="p">]</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="compute_combined_features-233"><a href="#compute_combined_features-233"><span class="linenos">233</span></a>            <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">el</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">tmp_feature</span><span class="p">):</span>
+</span><span id="compute_combined_features-234"><a href="#compute_combined_features-234"><span class="linenos">234</span></a>                <span class="n">combined_feature</span><span class="p">[</span><span class="n">enx</span><span class="p">]</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span>
+</span><span id="compute_combined_features-235"><a href="#compute_combined_features-235"><span class="linenos">235</span></a>                    <span class="n">internal_hash</span><span class="p">(</span>
+</span><span id="compute_combined_features-236"><a href="#compute_combined_features-236"><span class="linenos">236</span></a>                        <span class="nb">str</span><span class="p">(</span><span class="n">combined_feature</span><span class="p">[</span><span class="n">enx</span><span class="p">])</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="n">el</span><span class="p">),</span>
+</span><span id="compute_combined_features-237"><a href="#compute_combined_features-237"><span class="linenos">237</span></a>                    <span class="p">),</span>
+</span><span id="compute_combined_features-238"><a href="#compute_combined_features-238"><span class="linenos">238</span></a>                <span class="p">)</span>
+</span><span id="compute_combined_features-239"><a href="#compute_combined_features-239"><span class="linenos">239</span></a>        <span class="n">ftr_name</span> <span class="o">=</span> <span class="n">join_string</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">new_combination</span><span class="p">)</span>
+</span><span id="compute_combined_features-240"><a href="#compute_combined_features-240"><span class="linenos">240</span></a>        <span class="n">new_feature_hash</span><span class="p">[</span><span class="n">ftr_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">combined_feature</span>
+</span><span id="compute_combined_features-241"><a href="#compute_combined_features-241"><span class="linenos">241</span></a>        <span class="n">com_counter</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="compute_combined_features-242"><a href="#compute_combined_features-242"><span class="linenos">242</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">new_feature_hash</span><span class="p">)</span>
+</span><span id="compute_combined_features-243"><a href="#compute_combined_features-243"><span class="linenos">243</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Concatenating into final frame ..&#39;</span><span class="p">)</span>
+</span><span id="compute_combined_features-244"><a href="#compute_combined_features-244"><span class="linenos">244</span></a>    <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">([</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="compute_combined_features-245"><a href="#compute_combined_features-245"><span class="linenos">245</span></a>    <span class="k">del</span> <span class="n">tmp_df</span>
+</span><span id="compute_combined_features-246"><a href="#compute_combined_features-246"><span class="linenos">246</span></a>
+</span><span id="compute_combined_features-247"><a href="#compute_combined_features-247"><span class="linenos">247</span></a>    <span class="k">return</span> <span class="n">input_dataframe</span>
 </span></pre></div>
 
 
@@ -1254,7 +1267,7 @@ <h1 class="modulename">
                 <section id="compute_expanded_multivalue_features">
                             <input id="compute_expanded_multivalue_features-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">compute_expanded_multivalue_features</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>,</span><span class="param">	<span class="n">logger</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">args</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>:</span></span>
 
@@ -1262,48 +1275,48 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#compute_expanded_multivalue_features"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_expanded_multivalue_features-233"><a href="#compute_expanded_multivalue_features-233"><span class="linenos">233</span></a><span class="k">def</span> <span class="nf">compute_expanded_multivalue_features</span><span class="p">(</span>
-</span><span id="compute_expanded_multivalue_features-234"><a href="#compute_expanded_multivalue_features-234"><span class="linenos">234</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="compute_expanded_multivalue_features-235"><a href="#compute_expanded_multivalue_features-235"><span class="linenos">235</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="compute_expanded_multivalue_features-236"><a href="#compute_expanded_multivalue_features-236"><span class="linenos">236</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute one-hot encoded feature space based on each designated multivalue feature. E.g., feature with value &quot;a,b,c&quot; becomes three features, values of which are presence of a given value in a mutlivalue feature of choice.&quot;&quot;&quot;</span>
-</span><span id="compute_expanded_multivalue_features-237"><a href="#compute_expanded_multivalue_features-237"><span class="linenos">237</span></a>
-</span><span id="compute_expanded_multivalue_features-238"><a href="#compute_expanded_multivalue_features-238"><span class="linenos">238</span></a>    <span class="n">considered_multivalue_features</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">explode_multivalue_features</span><span class="o">.</span><span class="n">split</span><span class="p">(</span>
-</span><span id="compute_expanded_multivalue_features-239"><a href="#compute_expanded_multivalue_features-239"><span class="linenos">239</span></a>        <span class="s1">&#39;;&#39;</span><span class="p">,</span>
-</span><span id="compute_expanded_multivalue_features-240"><a href="#compute_expanded_multivalue_features-240"><span class="linenos">240</span></a>    <span class="p">)</span>
-</span><span id="compute_expanded_multivalue_features-241"><a href="#compute_expanded_multivalue_features-241"><span class="linenos">241</span></a>    <span class="n">new_feature_hash</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="compute_expanded_multivalue_features-242"><a href="#compute_expanded_multivalue_features-242"><span class="linenos">242</span></a>    <span class="n">missing_symbols</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">missing_value_symbols</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))</span>
-</span><span id="compute_expanded_multivalue_features-243"><a href="#compute_expanded_multivalue_features-243"><span class="linenos">243</span></a>
-</span><span id="compute_expanded_multivalue_features-244"><a href="#compute_expanded_multivalue_features-244"><span class="linenos">244</span></a>    <span class="k">for</span> <span class="n">multivalue_feature</span> <span class="ow">in</span> <span class="n">considered_multivalue_features</span><span class="p">:</span>
-</span><span id="compute_expanded_multivalue_features-245"><a href="#compute_expanded_multivalue_features-245"><span class="linenos">245</span></a>        <span class="n">multivalue_feature_vector</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">multivalue_feature</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">(</span>
-</span><span id="compute_expanded_multivalue_features-246"><a href="#compute_expanded_multivalue_features-246"><span class="linenos">246</span></a>        <span class="p">)</span>
-</span><span id="compute_expanded_multivalue_features-247"><a href="#compute_expanded_multivalue_features-247"><span class="linenos">247</span></a>        <span class="n">multivalue_feature_vector</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="compute_expanded_multivalue_features-248"><a href="#compute_expanded_multivalue_features-248"><span class="linenos">248</span></a>            <span class="n">x</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">,</span> <span class="s1">&#39;-&#39;</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">multivalue_feature_vector</span>
-</span><span id="compute_expanded_multivalue_features-249"><a href="#compute_expanded_multivalue_features-249"><span class="linenos">249</span></a>        <span class="p">]</span>
-</span><span id="compute_expanded_multivalue_features-250"><a href="#compute_expanded_multivalue_features-250"><span class="linenos">250</span></a>        <span class="n">multivalue_sets</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="compute_expanded_multivalue_features-251"><a href="#compute_expanded_multivalue_features-251"><span class="linenos">251</span></a>            <span class="nb">set</span><span class="p">(</span><span class="n">x</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;-&#39;</span><span class="p">))</span>
-</span><span id="compute_expanded_multivalue_features-252"><a href="#compute_expanded_multivalue_features-252"><span class="linenos">252</span></a>            <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">multivalue_feature_vector</span>
-</span><span id="compute_expanded_multivalue_features-253"><a href="#compute_expanded_multivalue_features-253"><span class="linenos">253</span></a>        <span class="p">]</span>
-</span><span id="compute_expanded_multivalue_features-254"><a href="#compute_expanded_multivalue_features-254"><span class="linenos">254</span></a>        <span class="n">unique_values</span> <span class="o">=</span> <span class="nb">set</span><span class="o">.</span><span class="n">union</span><span class="p">(</span><span class="o">*</span><span class="n">multivalue_sets</span><span class="p">)</span>
-</span><span id="compute_expanded_multivalue_features-255"><a href="#compute_expanded_multivalue_features-255"><span class="linenos">255</span></a>
-</span><span id="compute_expanded_multivalue_features-256"><a href="#compute_expanded_multivalue_features-256"><span class="linenos">256</span></a>        <span class="k">for</span> <span class="n">missing_symbol</span> <span class="ow">in</span> <span class="n">missing_symbols</span><span class="p">:</span>
-</span><span id="compute_expanded_multivalue_features-257"><a href="#compute_expanded_multivalue_features-257"><span class="linenos">257</span></a>            <span class="k">if</span> <span class="n">missing_symbol</span> <span class="ow">in</span> <span class="n">unique_values</span><span class="p">:</span>
-</span><span id="compute_expanded_multivalue_features-258"><a href="#compute_expanded_multivalue_features-258"><span class="linenos">258</span></a>                <span class="n">unique_values</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">missing_symbol</span><span class="p">)</span>
-</span><span id="compute_expanded_multivalue_features-259"><a href="#compute_expanded_multivalue_features-259"><span class="linenos">259</span></a>
-</span><span id="compute_expanded_multivalue_features-260"><a href="#compute_expanded_multivalue_features-260"><span class="linenos">260</span></a>        <span class="k">for</span> <span class="n">unique_value</span> <span class="ow">in</span> <span class="n">unique_values</span><span class="p">:</span>
-</span><span id="compute_expanded_multivalue_features-261"><a href="#compute_expanded_multivalue_features-261"><span class="linenos">261</span></a>            <span class="n">tmp_vec</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="compute_expanded_multivalue_features-262"><a href="#compute_expanded_multivalue_features-262"><span class="linenos">262</span></a>            <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">multivalue</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">multivalue_sets</span><span class="p">):</span>
-</span><span id="compute_expanded_multivalue_features-263"><a href="#compute_expanded_multivalue_features-263"><span class="linenos">263</span></a>                <span class="k">if</span> <span class="n">unique_value</span> <span class="ow">in</span> <span class="n">multivalue</span><span class="p">:</span>
-</span><span id="compute_expanded_multivalue_features-264"><a href="#compute_expanded_multivalue_features-264"><span class="linenos">264</span></a>                    <span class="n">tmp_vec</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="s1">&#39;1&#39;</span><span class="p">)</span>
-</span><span id="compute_expanded_multivalue_features-265"><a href="#compute_expanded_multivalue_features-265"><span class="linenos">265</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="compute_expanded_multivalue_features-266"><a href="#compute_expanded_multivalue_features-266"><span class="linenos">266</span></a>                    <span class="n">tmp_vec</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
-</span><span id="compute_expanded_multivalue_features-267"><a href="#compute_expanded_multivalue_features-267"><span class="linenos">267</span></a>
-</span><span id="compute_expanded_multivalue_features-268"><a href="#compute_expanded_multivalue_features-268"><span class="linenos">268</span></a>            <span class="n">new_feature_hash</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;MULTIEX-</span><span class="si">{</span><span class="n">multivalue_feature</span><span class="si">}</span><span class="s1">-</span><span class="si">{</span><span class="n">unique_value</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tmp_vec</span>
-</span><span id="compute_expanded_multivalue_features-269"><a href="#compute_expanded_multivalue_features-269"><span class="linenos">269</span></a>
-</span><span id="compute_expanded_multivalue_features-270"><a href="#compute_expanded_multivalue_features-270"><span class="linenos">270</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">new_feature_hash</span><span class="p">)</span>
-</span><span id="compute_expanded_multivalue_features-271"><a href="#compute_expanded_multivalue_features-271"><span class="linenos">271</span></a>    <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">([</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="compute_expanded_multivalue_features-272"><a href="#compute_expanded_multivalue_features-272"><span class="linenos">272</span></a>    <span class="k">del</span> <span class="n">tmp_df</span>
-</span><span id="compute_expanded_multivalue_features-273"><a href="#compute_expanded_multivalue_features-273"><span class="linenos">273</span></a>
-</span><span id="compute_expanded_multivalue_features-274"><a href="#compute_expanded_multivalue_features-274"><span class="linenos">274</span></a>    <span class="k">return</span> <span class="n">input_dataframe</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_expanded_multivalue_features-250"><a href="#compute_expanded_multivalue_features-250"><span class="linenos">250</span></a><span class="k">def</span> <span class="nf">compute_expanded_multivalue_features</span><span class="p">(</span>
+</span><span id="compute_expanded_multivalue_features-251"><a href="#compute_expanded_multivalue_features-251"><span class="linenos">251</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="compute_expanded_multivalue_features-252"><a href="#compute_expanded_multivalue_features-252"><span class="linenos">252</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="compute_expanded_multivalue_features-253"><a href="#compute_expanded_multivalue_features-253"><span class="linenos">253</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute one-hot encoded feature space based on each designated multivalue feature. E.g., feature with value &quot;a,b,c&quot; becomes three features, values of which are presence of a given value in a mutlivalue feature of choice.&quot;&quot;&quot;</span>
+</span><span id="compute_expanded_multivalue_features-254"><a href="#compute_expanded_multivalue_features-254"><span class="linenos">254</span></a>
+</span><span id="compute_expanded_multivalue_features-255"><a href="#compute_expanded_multivalue_features-255"><span class="linenos">255</span></a>    <span class="n">considered_multivalue_features</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">explode_multivalue_features</span><span class="o">.</span><span class="n">split</span><span class="p">(</span>
+</span><span id="compute_expanded_multivalue_features-256"><a href="#compute_expanded_multivalue_features-256"><span class="linenos">256</span></a>        <span class="s1">&#39;;&#39;</span><span class="p">,</span>
+</span><span id="compute_expanded_multivalue_features-257"><a href="#compute_expanded_multivalue_features-257"><span class="linenos">257</span></a>    <span class="p">)</span>
+</span><span id="compute_expanded_multivalue_features-258"><a href="#compute_expanded_multivalue_features-258"><span class="linenos">258</span></a>    <span class="n">new_feature_hash</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="compute_expanded_multivalue_features-259"><a href="#compute_expanded_multivalue_features-259"><span class="linenos">259</span></a>    <span class="n">missing_symbols</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">missing_value_symbols</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))</span>
+</span><span id="compute_expanded_multivalue_features-260"><a href="#compute_expanded_multivalue_features-260"><span class="linenos">260</span></a>
+</span><span id="compute_expanded_multivalue_features-261"><a href="#compute_expanded_multivalue_features-261"><span class="linenos">261</span></a>    <span class="k">for</span> <span class="n">multivalue_feature</span> <span class="ow">in</span> <span class="n">considered_multivalue_features</span><span class="p">:</span>
+</span><span id="compute_expanded_multivalue_features-262"><a href="#compute_expanded_multivalue_features-262"><span class="linenos">262</span></a>        <span class="n">multivalue_feature_vector</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">multivalue_feature</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">(</span>
+</span><span id="compute_expanded_multivalue_features-263"><a href="#compute_expanded_multivalue_features-263"><span class="linenos">263</span></a>        <span class="p">)</span>
+</span><span id="compute_expanded_multivalue_features-264"><a href="#compute_expanded_multivalue_features-264"><span class="linenos">264</span></a>        <span class="n">multivalue_feature_vector</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="compute_expanded_multivalue_features-265"><a href="#compute_expanded_multivalue_features-265"><span class="linenos">265</span></a>            <span class="n">x</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">,</span> <span class="s1">&#39;-&#39;</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">multivalue_feature_vector</span>
+</span><span id="compute_expanded_multivalue_features-266"><a href="#compute_expanded_multivalue_features-266"><span class="linenos">266</span></a>        <span class="p">]</span>
+</span><span id="compute_expanded_multivalue_features-267"><a href="#compute_expanded_multivalue_features-267"><span class="linenos">267</span></a>        <span class="n">multivalue_sets</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="compute_expanded_multivalue_features-268"><a href="#compute_expanded_multivalue_features-268"><span class="linenos">268</span></a>            <span class="nb">set</span><span class="p">(</span><span class="n">x</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;-&#39;</span><span class="p">))</span>
+</span><span id="compute_expanded_multivalue_features-269"><a href="#compute_expanded_multivalue_features-269"><span class="linenos">269</span></a>            <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">multivalue_feature_vector</span>
+</span><span id="compute_expanded_multivalue_features-270"><a href="#compute_expanded_multivalue_features-270"><span class="linenos">270</span></a>        <span class="p">]</span>
+</span><span id="compute_expanded_multivalue_features-271"><a href="#compute_expanded_multivalue_features-271"><span class="linenos">271</span></a>        <span class="n">unique_values</span> <span class="o">=</span> <span class="nb">set</span><span class="o">.</span><span class="n">union</span><span class="p">(</span><span class="o">*</span><span class="n">multivalue_sets</span><span class="p">)</span>
+</span><span id="compute_expanded_multivalue_features-272"><a href="#compute_expanded_multivalue_features-272"><span class="linenos">272</span></a>
+</span><span id="compute_expanded_multivalue_features-273"><a href="#compute_expanded_multivalue_features-273"><span class="linenos">273</span></a>        <span class="k">for</span> <span class="n">missing_symbol</span> <span class="ow">in</span> <span class="n">missing_symbols</span><span class="p">:</span>
+</span><span id="compute_expanded_multivalue_features-274"><a href="#compute_expanded_multivalue_features-274"><span class="linenos">274</span></a>            <span class="k">if</span> <span class="n">missing_symbol</span> <span class="ow">in</span> <span class="n">unique_values</span><span class="p">:</span>
+</span><span id="compute_expanded_multivalue_features-275"><a href="#compute_expanded_multivalue_features-275"><span class="linenos">275</span></a>                <span class="n">unique_values</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">missing_symbol</span><span class="p">)</span>
+</span><span id="compute_expanded_multivalue_features-276"><a href="#compute_expanded_multivalue_features-276"><span class="linenos">276</span></a>
+</span><span id="compute_expanded_multivalue_features-277"><a href="#compute_expanded_multivalue_features-277"><span class="linenos">277</span></a>        <span class="k">for</span> <span class="n">unique_value</span> <span class="ow">in</span> <span class="n">unique_values</span><span class="p">:</span>
+</span><span id="compute_expanded_multivalue_features-278"><a href="#compute_expanded_multivalue_features-278"><span class="linenos">278</span></a>            <span class="n">tmp_vec</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="compute_expanded_multivalue_features-279"><a href="#compute_expanded_multivalue_features-279"><span class="linenos">279</span></a>            <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">multivalue</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">multivalue_sets</span><span class="p">):</span>
+</span><span id="compute_expanded_multivalue_features-280"><a href="#compute_expanded_multivalue_features-280"><span class="linenos">280</span></a>                <span class="k">if</span> <span class="n">unique_value</span> <span class="ow">in</span> <span class="n">multivalue</span><span class="p">:</span>
+</span><span id="compute_expanded_multivalue_features-281"><a href="#compute_expanded_multivalue_features-281"><span class="linenos">281</span></a>                    <span class="n">tmp_vec</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="s1">&#39;1&#39;</span><span class="p">)</span>
+</span><span id="compute_expanded_multivalue_features-282"><a href="#compute_expanded_multivalue_features-282"><span class="linenos">282</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="compute_expanded_multivalue_features-283"><a href="#compute_expanded_multivalue_features-283"><span class="linenos">283</span></a>                    <span class="n">tmp_vec</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
+</span><span id="compute_expanded_multivalue_features-284"><a href="#compute_expanded_multivalue_features-284"><span class="linenos">284</span></a>
+</span><span id="compute_expanded_multivalue_features-285"><a href="#compute_expanded_multivalue_features-285"><span class="linenos">285</span></a>            <span class="n">new_feature_hash</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;MULTIEX-</span><span class="si">{</span><span class="n">multivalue_feature</span><span class="si">}</span><span class="s1">-</span><span class="si">{</span><span class="n">unique_value</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">tmp_vec</span>
+</span><span id="compute_expanded_multivalue_features-286"><a href="#compute_expanded_multivalue_features-286"><span class="linenos">286</span></a>
+</span><span id="compute_expanded_multivalue_features-287"><a href="#compute_expanded_multivalue_features-287"><span class="linenos">287</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">new_feature_hash</span><span class="p">)</span>
+</span><span id="compute_expanded_multivalue_features-288"><a href="#compute_expanded_multivalue_features-288"><span class="linenos">288</span></a>    <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">([</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="compute_expanded_multivalue_features-289"><a href="#compute_expanded_multivalue_features-289"><span class="linenos">289</span></a>    <span class="k">del</span> <span class="n">tmp_df</span>
+</span><span id="compute_expanded_multivalue_features-290"><a href="#compute_expanded_multivalue_features-290"><span class="linenos">290</span></a>
+</span><span id="compute_expanded_multivalue_features-291"><a href="#compute_expanded_multivalue_features-291"><span class="linenos">291</span></a>    <span class="k">return</span> <span class="n">input_dataframe</span>
 </span></pre></div>
 
 
@@ -1315,7 +1328,7 @@ <h1 class="modulename">
                 <section id="compute_subfeatures">
                             <input id="compute_subfeatures-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">compute_subfeatures</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>,</span><span class="param">	<span class="n">logger</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">args</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>:</span></span>
 
@@ -1323,85 +1336,85 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#compute_subfeatures"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_subfeatures-277"><a href="#compute_subfeatures-277"><span class="linenos">277</span></a><span class="k">def</span> <span class="nf">compute_subfeatures</span><span class="p">(</span>
-</span><span id="compute_subfeatures-278"><a href="#compute_subfeatures-278"><span class="linenos">278</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="compute_subfeatures-279"><a href="#compute_subfeatures-279"><span class="linenos">279</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="compute_subfeatures-280"><a href="#compute_subfeatures-280"><span class="linenos">280</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute derived features that are more fine-grained. Implements logic around two operators that govern feature construction.</span>
-</span><span id="compute_subfeatures-281"><a href="#compute_subfeatures-281"><span class="linenos">281</span></a><span class="sd">    -&gt;: One sided construction - every value from left side is fine, separate ones from the right side feature will be considered.</span>
-</span><span id="compute_subfeatures-282"><a href="#compute_subfeatures-282"><span class="linenos">282</span></a><span class="sd">    &lt;-&gt;: Two sided construction - two-sided values present. This means that each value from a is combined with each from b, forming |A|*|B| new features (one-hot encoded)</span>
-</span><span id="compute_subfeatures-283"><a href="#compute_subfeatures-283"><span class="linenos">283</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="compute_subfeatures-284"><a href="#compute_subfeatures-284"><span class="linenos">284</span></a>
-</span><span id="compute_subfeatures-285"><a href="#compute_subfeatures-285"><span class="linenos">285</span></a>    <span class="n">all_subfeature_pair_seeds</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">subfeature_mapping</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;;&#39;</span><span class="p">)</span>
-</span><span id="compute_subfeatures-286"><a href="#compute_subfeatures-286"><span class="linenos">286</span></a>    <span class="n">new_feature_hash</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
-</span><span id="compute_subfeatures-287"><a href="#compute_subfeatures-287"><span class="linenos">287</span></a>
-</span><span id="compute_subfeatures-288"><a href="#compute_subfeatures-288"><span class="linenos">288</span></a>    <span class="k">for</span> <span class="n">seed_pair</span> <span class="ow">in</span> <span class="n">all_subfeature_pair_seeds</span><span class="p">:</span>
-</span><span id="compute_subfeatures-289"><a href="#compute_subfeatures-289"><span class="linenos">289</span></a>        <span class="k">if</span> <span class="s1">&#39;&lt;-&gt;&#39;</span> <span class="ow">in</span> <span class="n">seed_pair</span><span class="p">:</span>
-</span><span id="compute_subfeatures-290"><a href="#compute_subfeatures-290"><span class="linenos">290</span></a>            <span class="n">feature_first</span><span class="p">,</span> <span class="n">feature_second</span> <span class="o">=</span> <span class="n">seed_pair</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;&lt;-&gt;&#39;</span><span class="p">)</span>
-</span><span id="compute_subfeatures-291"><a href="#compute_subfeatures-291"><span class="linenos">291</span></a>
-</span><span id="compute_subfeatures-292"><a href="#compute_subfeatures-292"><span class="linenos">292</span></a>        <span class="k">elif</span> <span class="s1">&#39;-&gt;&#39;</span> <span class="ow">in</span> <span class="n">seed_pair</span><span class="p">:</span>
-</span><span id="compute_subfeatures-293"><a href="#compute_subfeatures-293"><span class="linenos">293</span></a>            <span class="n">feature_first</span><span class="p">,</span> <span class="n">feature_second</span> <span class="o">=</span> <span class="n">seed_pair</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;-&gt;&#39;</span><span class="p">)</span>
-</span><span id="compute_subfeatures-294"><a href="#compute_subfeatures-294"><span class="linenos">294</span></a>
-</span><span id="compute_subfeatures-295"><a href="#compute_subfeatures-295"><span class="linenos">295</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="compute_subfeatures-296"><a href="#compute_subfeatures-296"><span class="linenos">296</span></a>            <span class="k">raise</span> <span class="ne">NotImplementedError</span><span class="p">(</span>
-</span><span id="compute_subfeatures-297"><a href="#compute_subfeatures-297"><span class="linenos">297</span></a>                <span class="s1">&#39;Please specify valid subfeature operator (&lt;-&gt; or -&gt;)&#39;</span><span class="p">,</span>
-</span><span id="compute_subfeatures-298"><a href="#compute_subfeatures-298"><span class="linenos">298</span></a>            <span class="p">)</span>
-</span><span id="compute_subfeatures-299"><a href="#compute_subfeatures-299"><span class="linenos">299</span></a>
-</span><span id="compute_subfeatures-300"><a href="#compute_subfeatures-300"><span class="linenos">300</span></a>        <span class="n">subframe</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[[</span><span class="n">feature_first</span><span class="p">,</span> <span class="n">feature_second</span><span class="p">]]</span>
-</span><span id="compute_subfeatures-301"><a href="#compute_subfeatures-301"><span class="linenos">301</span></a>        <span class="n">unique_feature_second</span> <span class="o">=</span> <span class="n">subframe</span><span class="p">[</span><span class="n">feature_second</span><span class="p">]</span><span class="o">.</span><span class="n">unique</span><span class="p">()</span>
-</span><span id="compute_subfeatures-302"><a href="#compute_subfeatures-302"><span class="linenos">302</span></a>        <span class="n">feature_first_vec</span> <span class="o">=</span> <span class="n">subframe</span><span class="p">[</span><span class="n">feature_first</span><span class="p">]</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="compute_subfeatures-303"><a href="#compute_subfeatures-303"><span class="linenos">303</span></a>        <span class="n">feature_second_vec</span> <span class="o">=</span> <span class="n">subframe</span><span class="p">[</span><span class="n">feature_second</span><span class="p">]</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="compute_subfeatures-304"><a href="#compute_subfeatures-304"><span class="linenos">304</span></a>        <span class="n">out_template_feature</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="compute_subfeatures-305"><a href="#compute_subfeatures-305"><span class="linenos">305</span></a>            <span class="p">(</span><span class="n">a</span><span class="p">,</span> <span class="n">b</span><span class="p">)</span> <span class="k">for</span> <span class="n">a</span><span class="p">,</span> <span class="n">b</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">feature_first_vec</span><span class="p">,</span> <span class="n">feature_second_vec</span><span class="p">)</span>
-</span><span id="compute_subfeatures-306"><a href="#compute_subfeatures-306"><span class="linenos">306</span></a>        <span class="p">]</span>
-</span><span id="compute_subfeatures-307"><a href="#compute_subfeatures-307"><span class="linenos">307</span></a>
-</span><span id="compute_subfeatures-308"><a href="#compute_subfeatures-308"><span class="linenos">308</span></a>        <span class="k">if</span> <span class="s1">&#39;&lt;-&gt;&#39;</span> <span class="ow">in</span> <span class="n">seed_pair</span><span class="p">:</span>
-</span><span id="compute_subfeatures-309"><a href="#compute_subfeatures-309"><span class="linenos">309</span></a>            <span class="n">unique_feature_first</span> <span class="o">=</span> <span class="n">subframe</span><span class="p">[</span><span class="n">feature_first</span><span class="p">]</span><span class="o">.</span><span class="n">unique</span><span class="p">()</span>
-</span><span id="compute_subfeatures-310"><a href="#compute_subfeatures-310"><span class="linenos">310</span></a>
-</span><span id="compute_subfeatures-311"><a href="#compute_subfeatures-311"><span class="linenos">311</span></a>            <span class="n">mask_types</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="compute_subfeatures-312"><a href="#compute_subfeatures-312"><span class="linenos">312</span></a>            <span class="k">for</span> <span class="n">unique_target_feature_value</span> <span class="ow">in</span> <span class="n">unique_feature_second</span><span class="p">:</span>
-</span><span id="compute_subfeatures-313"><a href="#compute_subfeatures-313"><span class="linenos">313</span></a>                <span class="k">for</span> <span class="n">unique_seed_feature_value</span> <span class="ow">in</span> <span class="n">unique_feature_first</span><span class="p">:</span>
-</span><span id="compute_subfeatures-314"><a href="#compute_subfeatures-314"><span class="linenos">314</span></a>                    <span class="n">mask_types</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-</span><span id="compute_subfeatures-315"><a href="#compute_subfeatures-315"><span class="linenos">315</span></a>                        <span class="p">(</span><span class="n">unique_seed_feature_value</span><span class="p">,</span> <span class="n">unique_target_feature_value</span><span class="p">),</span>
-</span><span id="compute_subfeatures-316"><a href="#compute_subfeatures-316"><span class="linenos">316</span></a>                    <span class="p">)</span>
-</span><span id="compute_subfeatures-317"><a href="#compute_subfeatures-317"><span class="linenos">317</span></a>
-</span><span id="compute_subfeatures-318"><a href="#compute_subfeatures-318"><span class="linenos">318</span></a>            <span class="k">for</span> <span class="n">mask_type</span> <span class="ow">in</span> <span class="n">mask_types</span><span class="p">:</span>
-</span><span id="compute_subfeatures-319"><a href="#compute_subfeatures-319"><span class="linenos">319</span></a>                <span class="n">new_feature</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="compute_subfeatures-320"><a href="#compute_subfeatures-320"><span class="linenos">320</span></a>                <span class="k">for</span> <span class="n">value_tuple</span> <span class="ow">in</span> <span class="n">out_template_feature</span><span class="p">:</span>
-</span><span id="compute_subfeatures-321"><a href="#compute_subfeatures-321"><span class="linenos">321</span></a>                    <span class="k">if</span> <span class="p">(</span>
-</span><span id="compute_subfeatures-322"><a href="#compute_subfeatures-322"><span class="linenos">322</span></a>                        <span class="n">value_tuple</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="n">mask_type</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="compute_subfeatures-323"><a href="#compute_subfeatures-323"><span class="linenos">323</span></a>                        <span class="ow">and</span> <span class="n">value_tuple</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">==</span> <span class="n">mask_type</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="compute_subfeatures-324"><a href="#compute_subfeatures-324"><span class="linenos">324</span></a>                    <span class="p">):</span>
-</span><span id="compute_subfeatures-325"><a href="#compute_subfeatures-325"><span class="linenos">325</span></a>                        <span class="n">new_feature</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="mi">1</span><span class="p">))</span>
-</span><span id="compute_subfeatures-326"><a href="#compute_subfeatures-326"><span class="linenos">326</span></a>                    <span class="k">else</span><span class="p">:</span>
-</span><span id="compute_subfeatures-327"><a href="#compute_subfeatures-327"><span class="linenos">327</span></a>                        <span class="n">new_feature</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="mi">0</span><span class="p">))</span>
-</span><span id="compute_subfeatures-328"><a href="#compute_subfeatures-328"><span class="linenos">328</span></a>                <span class="n">feature_name</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="compute_subfeatures-329"><a href="#compute_subfeatures-329"><span class="linenos">329</span></a>                    <span class="sa">f</span><span class="s1">&#39;SUBFEATURE|</span><span class="si">{</span><span class="n">feature_first</span><span class="si">}</span><span class="s1">|</span><span class="si">{</span><span class="n">feature_second</span><span class="si">}</span><span class="s1">-&#39;</span>
-</span><span id="compute_subfeatures-330"><a href="#compute_subfeatures-330"><span class="linenos">330</span></a>                    <span class="o">+</span> <span class="n">mask_type</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="compute_subfeatures-331"><a href="#compute_subfeatures-331"><span class="linenos">331</span></a>                    <span class="o">+</span> <span class="s1">&#39;&amp;&#39;</span>
-</span><span id="compute_subfeatures-332"><a href="#compute_subfeatures-332"><span class="linenos">332</span></a>                    <span class="o">+</span> <span class="n">mask_type</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="compute_subfeatures-333"><a href="#compute_subfeatures-333"><span class="linenos">333</span></a>                <span class="p">)</span>
-</span><span id="compute_subfeatures-334"><a href="#compute_subfeatures-334"><span class="linenos">334</span></a>                <span class="n">new_feature_hash</span><span class="p">[</span><span class="n">feature_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_feature</span>
-</span><span id="compute_subfeatures-335"><a href="#compute_subfeatures-335"><span class="linenos">335</span></a>
-</span><span id="compute_subfeatures-336"><a href="#compute_subfeatures-336"><span class="linenos">336</span></a>            <span class="k">del</span> <span class="n">new_feature</span>
-</span><span id="compute_subfeatures-337"><a href="#compute_subfeatures-337"><span class="linenos">337</span></a>
-</span><span id="compute_subfeatures-338"><a href="#compute_subfeatures-338"><span class="linenos">338</span></a>        <span class="k">elif</span> <span class="s1">&#39;-&gt;&#39;</span> <span class="ow">in</span> <span class="n">seed_pair</span><span class="p">:</span>
-</span><span id="compute_subfeatures-339"><a href="#compute_subfeatures-339"><span class="linenos">339</span></a>            <span class="k">for</span> <span class="n">unique_target_feature_value</span> <span class="ow">in</span> <span class="n">unique_feature_second</span><span class="p">:</span>
-</span><span id="compute_subfeatures-340"><a href="#compute_subfeatures-340"><span class="linenos">340</span></a>                <span class="n">tmp_new_feature</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="compute_subfeatures-341"><a href="#compute_subfeatures-341"><span class="linenos">341</span></a>                    <span class="s1">&#39;AND&#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
-</span><span id="compute_subfeatures-342"><a href="#compute_subfeatures-342"><span class="linenos">342</span></a>                        <span class="n">x</span><span class="p">,</span>
-</span><span id="compute_subfeatures-343"><a href="#compute_subfeatures-343"><span class="linenos">343</span></a>                    <span class="p">)</span> <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">==</span> <span class="n">unique_target_feature_value</span> <span class="k">else</span> <span class="s1">&#39;&#39;</span>
-</span><span id="compute_subfeatures-344"><a href="#compute_subfeatures-344"><span class="linenos">344</span></a>                    <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">out_template_feature</span>
-</span><span id="compute_subfeatures-345"><a href="#compute_subfeatures-345"><span class="linenos">345</span></a>                <span class="p">]</span>
-</span><span id="compute_subfeatures-346"><a href="#compute_subfeatures-346"><span class="linenos">346</span></a>                <span class="n">feature_name_final</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="compute_subfeatures-347"><a href="#compute_subfeatures-347"><span class="linenos">347</span></a>                    <span class="s1">&#39;SUBFEATURE-&#39;</span> <span class="o">+</span> <span class="n">feature_first</span> <span class="o">+</span> <span class="s1">&#39;&amp;&#39;</span> <span class="o">+</span> <span class="n">unique_target_feature_value</span>
-</span><span id="compute_subfeatures-348"><a href="#compute_subfeatures-348"><span class="linenos">348</span></a>                <span class="p">)</span>
-</span><span id="compute_subfeatures-349"><a href="#compute_subfeatures-349"><span class="linenos">349</span></a>                <span class="n">new_feature_hash</span><span class="p">[</span><span class="n">feature_name_final</span><span class="p">]</span> <span class="o">=</span> <span class="n">tmp_new_feature</span>
-</span><span id="compute_subfeatures-350"><a href="#compute_subfeatures-350"><span class="linenos">350</span></a>
-</span><span id="compute_subfeatures-351"><a href="#compute_subfeatures-351"><span class="linenos">351</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">new_feature_hash</span><span class="p">)</span>
-</span><span id="compute_subfeatures-352"><a href="#compute_subfeatures-352"><span class="linenos">352</span></a>    <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">([</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="compute_subfeatures-353"><a href="#compute_subfeatures-353"><span class="linenos">353</span></a>
-</span><span id="compute_subfeatures-354"><a href="#compute_subfeatures-354"><span class="linenos">354</span></a>    <span class="k">del</span> <span class="n">tmp_df</span>
-</span><span id="compute_subfeatures-355"><a href="#compute_subfeatures-355"><span class="linenos">355</span></a>    <span class="k">return</span> <span class="n">input_dataframe</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_subfeatures-294"><a href="#compute_subfeatures-294"><span class="linenos">294</span></a><span class="k">def</span> <span class="nf">compute_subfeatures</span><span class="p">(</span>
+</span><span id="compute_subfeatures-295"><a href="#compute_subfeatures-295"><span class="linenos">295</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="compute_subfeatures-296"><a href="#compute_subfeatures-296"><span class="linenos">296</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="compute_subfeatures-297"><a href="#compute_subfeatures-297"><span class="linenos">297</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute derived features that are more fine-grained. Implements logic around two operators that govern feature construction.</span>
+</span><span id="compute_subfeatures-298"><a href="#compute_subfeatures-298"><span class="linenos">298</span></a><span class="sd">    -&gt;: One sided construction - every value from left side is fine, separate ones from the right side feature will be considered.</span>
+</span><span id="compute_subfeatures-299"><a href="#compute_subfeatures-299"><span class="linenos">299</span></a><span class="sd">    &lt;-&gt;: Two sided construction - two-sided values present. This means that each value from a is combined with each from b, forming |A|*|B| new features (one-hot encoded)</span>
+</span><span id="compute_subfeatures-300"><a href="#compute_subfeatures-300"><span class="linenos">300</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="compute_subfeatures-301"><a href="#compute_subfeatures-301"><span class="linenos">301</span></a>
+</span><span id="compute_subfeatures-302"><a href="#compute_subfeatures-302"><span class="linenos">302</span></a>    <span class="n">all_subfeature_pair_seeds</span> <span class="o">=</span> <span class="n">args</span><span class="o">.</span><span class="n">subfeature_mapping</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;;&#39;</span><span class="p">)</span>
+</span><span id="compute_subfeatures-303"><a href="#compute_subfeatures-303"><span class="linenos">303</span></a>    <span class="n">new_feature_hash</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
+</span><span id="compute_subfeatures-304"><a href="#compute_subfeatures-304"><span class="linenos">304</span></a>
+</span><span id="compute_subfeatures-305"><a href="#compute_subfeatures-305"><span class="linenos">305</span></a>    <span class="k">for</span> <span class="n">seed_pair</span> <span class="ow">in</span> <span class="n">all_subfeature_pair_seeds</span><span class="p">:</span>
+</span><span id="compute_subfeatures-306"><a href="#compute_subfeatures-306"><span class="linenos">306</span></a>        <span class="k">if</span> <span class="s1">&#39;&lt;-&gt;&#39;</span> <span class="ow">in</span> <span class="n">seed_pair</span><span class="p">:</span>
+</span><span id="compute_subfeatures-307"><a href="#compute_subfeatures-307"><span class="linenos">307</span></a>            <span class="n">feature_first</span><span class="p">,</span> <span class="n">feature_second</span> <span class="o">=</span> <span class="n">seed_pair</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;&lt;-&gt;&#39;</span><span class="p">)</span>
+</span><span id="compute_subfeatures-308"><a href="#compute_subfeatures-308"><span class="linenos">308</span></a>
+</span><span id="compute_subfeatures-309"><a href="#compute_subfeatures-309"><span class="linenos">309</span></a>        <span class="k">elif</span> <span class="s1">&#39;-&gt;&#39;</span> <span class="ow">in</span> <span class="n">seed_pair</span><span class="p">:</span>
+</span><span id="compute_subfeatures-310"><a href="#compute_subfeatures-310"><span class="linenos">310</span></a>            <span class="n">feature_first</span><span class="p">,</span> <span class="n">feature_second</span> <span class="o">=</span> <span class="n">seed_pair</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;-&gt;&#39;</span><span class="p">)</span>
+</span><span id="compute_subfeatures-311"><a href="#compute_subfeatures-311"><span class="linenos">311</span></a>
+</span><span id="compute_subfeatures-312"><a href="#compute_subfeatures-312"><span class="linenos">312</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="compute_subfeatures-313"><a href="#compute_subfeatures-313"><span class="linenos">313</span></a>            <span class="k">raise</span> <span class="ne">NotImplementedError</span><span class="p">(</span>
+</span><span id="compute_subfeatures-314"><a href="#compute_subfeatures-314"><span class="linenos">314</span></a>                <span class="s1">&#39;Please specify valid subfeature operator (&lt;-&gt; or -&gt;)&#39;</span><span class="p">,</span>
+</span><span id="compute_subfeatures-315"><a href="#compute_subfeatures-315"><span class="linenos">315</span></a>            <span class="p">)</span>
+</span><span id="compute_subfeatures-316"><a href="#compute_subfeatures-316"><span class="linenos">316</span></a>
+</span><span id="compute_subfeatures-317"><a href="#compute_subfeatures-317"><span class="linenos">317</span></a>        <span class="n">subframe</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[[</span><span class="n">feature_first</span><span class="p">,</span> <span class="n">feature_second</span><span class="p">]]</span>
+</span><span id="compute_subfeatures-318"><a href="#compute_subfeatures-318"><span class="linenos">318</span></a>        <span class="n">unique_feature_second</span> <span class="o">=</span> <span class="n">subframe</span><span class="p">[</span><span class="n">feature_second</span><span class="p">]</span><span class="o">.</span><span class="n">unique</span><span class="p">()</span>
+</span><span id="compute_subfeatures-319"><a href="#compute_subfeatures-319"><span class="linenos">319</span></a>        <span class="n">feature_first_vec</span> <span class="o">=</span> <span class="n">subframe</span><span class="p">[</span><span class="n">feature_first</span><span class="p">]</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="compute_subfeatures-320"><a href="#compute_subfeatures-320"><span class="linenos">320</span></a>        <span class="n">feature_second_vec</span> <span class="o">=</span> <span class="n">subframe</span><span class="p">[</span><span class="n">feature_second</span><span class="p">]</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="compute_subfeatures-321"><a href="#compute_subfeatures-321"><span class="linenos">321</span></a>        <span class="n">out_template_feature</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="compute_subfeatures-322"><a href="#compute_subfeatures-322"><span class="linenos">322</span></a>            <span class="p">(</span><span class="n">a</span><span class="p">,</span> <span class="n">b</span><span class="p">)</span> <span class="k">for</span> <span class="n">a</span><span class="p">,</span> <span class="n">b</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">feature_first_vec</span><span class="p">,</span> <span class="n">feature_second_vec</span><span class="p">)</span>
+</span><span id="compute_subfeatures-323"><a href="#compute_subfeatures-323"><span class="linenos">323</span></a>        <span class="p">]</span>
+</span><span id="compute_subfeatures-324"><a href="#compute_subfeatures-324"><span class="linenos">324</span></a>
+</span><span id="compute_subfeatures-325"><a href="#compute_subfeatures-325"><span class="linenos">325</span></a>        <span class="k">if</span> <span class="s1">&#39;&lt;-&gt;&#39;</span> <span class="ow">in</span> <span class="n">seed_pair</span><span class="p">:</span>
+</span><span id="compute_subfeatures-326"><a href="#compute_subfeatures-326"><span class="linenos">326</span></a>            <span class="n">unique_feature_first</span> <span class="o">=</span> <span class="n">subframe</span><span class="p">[</span><span class="n">feature_first</span><span class="p">]</span><span class="o">.</span><span class="n">unique</span><span class="p">()</span>
+</span><span id="compute_subfeatures-327"><a href="#compute_subfeatures-327"><span class="linenos">327</span></a>
+</span><span id="compute_subfeatures-328"><a href="#compute_subfeatures-328"><span class="linenos">328</span></a>            <span class="n">mask_types</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="compute_subfeatures-329"><a href="#compute_subfeatures-329"><span class="linenos">329</span></a>            <span class="k">for</span> <span class="n">unique_target_feature_value</span> <span class="ow">in</span> <span class="n">unique_feature_second</span><span class="p">:</span>
+</span><span id="compute_subfeatures-330"><a href="#compute_subfeatures-330"><span class="linenos">330</span></a>                <span class="k">for</span> <span class="n">unique_seed_feature_value</span> <span class="ow">in</span> <span class="n">unique_feature_first</span><span class="p">:</span>
+</span><span id="compute_subfeatures-331"><a href="#compute_subfeatures-331"><span class="linenos">331</span></a>                    <span class="n">mask_types</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
+</span><span id="compute_subfeatures-332"><a href="#compute_subfeatures-332"><span class="linenos">332</span></a>                        <span class="p">(</span><span class="n">unique_seed_feature_value</span><span class="p">,</span> <span class="n">unique_target_feature_value</span><span class="p">),</span>
+</span><span id="compute_subfeatures-333"><a href="#compute_subfeatures-333"><span class="linenos">333</span></a>                    <span class="p">)</span>
+</span><span id="compute_subfeatures-334"><a href="#compute_subfeatures-334"><span class="linenos">334</span></a>
+</span><span id="compute_subfeatures-335"><a href="#compute_subfeatures-335"><span class="linenos">335</span></a>            <span class="k">for</span> <span class="n">mask_type</span> <span class="ow">in</span> <span class="n">mask_types</span><span class="p">:</span>
+</span><span id="compute_subfeatures-336"><a href="#compute_subfeatures-336"><span class="linenos">336</span></a>                <span class="n">new_feature</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="compute_subfeatures-337"><a href="#compute_subfeatures-337"><span class="linenos">337</span></a>                <span class="k">for</span> <span class="n">value_tuple</span> <span class="ow">in</span> <span class="n">out_template_feature</span><span class="p">:</span>
+</span><span id="compute_subfeatures-338"><a href="#compute_subfeatures-338"><span class="linenos">338</span></a>                    <span class="k">if</span> <span class="p">(</span>
+</span><span id="compute_subfeatures-339"><a href="#compute_subfeatures-339"><span class="linenos">339</span></a>                        <span class="n">value_tuple</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="n">mask_type</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="compute_subfeatures-340"><a href="#compute_subfeatures-340"><span class="linenos">340</span></a>                        <span class="ow">and</span> <span class="n">value_tuple</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">==</span> <span class="n">mask_type</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="compute_subfeatures-341"><a href="#compute_subfeatures-341"><span class="linenos">341</span></a>                    <span class="p">):</span>
+</span><span id="compute_subfeatures-342"><a href="#compute_subfeatures-342"><span class="linenos">342</span></a>                        <span class="n">new_feature</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="compute_subfeatures-343"><a href="#compute_subfeatures-343"><span class="linenos">343</span></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="compute_subfeatures-344"><a href="#compute_subfeatures-344"><span class="linenos">344</span></a>                        <span class="n">new_feature</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="mi">0</span><span class="p">))</span>
+</span><span id="compute_subfeatures-345"><a href="#compute_subfeatures-345"><span class="linenos">345</span></a>                <span class="n">feature_name</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="compute_subfeatures-346"><a href="#compute_subfeatures-346"><span class="linenos">346</span></a>                    <span class="sa">f</span><span class="s1">&#39;SUBFEATURE|</span><span class="si">{</span><span class="n">feature_first</span><span class="si">}</span><span class="s1">|</span><span class="si">{</span><span class="n">feature_second</span><span class="si">}</span><span class="s1">-&#39;</span>
+</span><span id="compute_subfeatures-347"><a href="#compute_subfeatures-347"><span class="linenos">347</span></a>                    <span class="o">+</span> <span class="n">mask_type</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="compute_subfeatures-348"><a href="#compute_subfeatures-348"><span class="linenos">348</span></a>                    <span class="o">+</span> <span class="s1">&#39;&amp;&#39;</span>
+</span><span id="compute_subfeatures-349"><a href="#compute_subfeatures-349"><span class="linenos">349</span></a>                    <span class="o">+</span> <span class="n">mask_type</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="compute_subfeatures-350"><a href="#compute_subfeatures-350"><span class="linenos">350</span></a>                <span class="p">)</span>
+</span><span id="compute_subfeatures-351"><a href="#compute_subfeatures-351"><span class="linenos">351</span></a>                <span class="n">new_feature_hash</span><span class="p">[</span><span class="n">feature_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">new_feature</span>
+</span><span id="compute_subfeatures-352"><a href="#compute_subfeatures-352"><span class="linenos">352</span></a>
+</span><span id="compute_subfeatures-353"><a href="#compute_subfeatures-353"><span class="linenos">353</span></a>            <span class="k">del</span> <span class="n">new_feature</span>
+</span><span id="compute_subfeatures-354"><a href="#compute_subfeatures-354"><span class="linenos">354</span></a>
+</span><span id="compute_subfeatures-355"><a href="#compute_subfeatures-355"><span class="linenos">355</span></a>        <span class="k">elif</span> <span class="s1">&#39;-&gt;&#39;</span> <span class="ow">in</span> <span class="n">seed_pair</span><span class="p">:</span>
+</span><span id="compute_subfeatures-356"><a href="#compute_subfeatures-356"><span class="linenos">356</span></a>            <span class="k">for</span> <span class="n">unique_target_feature_value</span> <span class="ow">in</span> <span class="n">unique_feature_second</span><span class="p">:</span>
+</span><span id="compute_subfeatures-357"><a href="#compute_subfeatures-357"><span class="linenos">357</span></a>                <span class="n">tmp_new_feature</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="compute_subfeatures-358"><a href="#compute_subfeatures-358"><span class="linenos">358</span></a>                    <span class="s1">&#39;AND&#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
+</span><span id="compute_subfeatures-359"><a href="#compute_subfeatures-359"><span class="linenos">359</span></a>                        <span class="n">x</span><span class="p">,</span>
+</span><span id="compute_subfeatures-360"><a href="#compute_subfeatures-360"><span class="linenos">360</span></a>                    <span class="p">)</span> <span class="k">if</span> <span class="n">x</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">==</span> <span class="n">unique_target_feature_value</span> <span class="k">else</span> <span class="s1">&#39;&#39;</span>
+</span><span id="compute_subfeatures-361"><a href="#compute_subfeatures-361"><span class="linenos">361</span></a>                    <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">out_template_feature</span>
+</span><span id="compute_subfeatures-362"><a href="#compute_subfeatures-362"><span class="linenos">362</span></a>                <span class="p">]</span>
+</span><span id="compute_subfeatures-363"><a href="#compute_subfeatures-363"><span class="linenos">363</span></a>                <span class="n">feature_name_final</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="compute_subfeatures-364"><a href="#compute_subfeatures-364"><span class="linenos">364</span></a>                    <span class="s1">&#39;SUBFEATURE-&#39;</span> <span class="o">+</span> <span class="n">feature_first</span> <span class="o">+</span> <span class="s1">&#39;&amp;&#39;</span> <span class="o">+</span> <span class="n">unique_target_feature_value</span>
+</span><span id="compute_subfeatures-365"><a href="#compute_subfeatures-365"><span class="linenos">365</span></a>                <span class="p">)</span>
+</span><span id="compute_subfeatures-366"><a href="#compute_subfeatures-366"><span class="linenos">366</span></a>                <span class="n">new_feature_hash</span><span class="p">[</span><span class="n">feature_name_final</span><span class="p">]</span> <span class="o">=</span> <span class="n">tmp_new_feature</span>
+</span><span id="compute_subfeatures-367"><a href="#compute_subfeatures-367"><span class="linenos">367</span></a>
+</span><span id="compute_subfeatures-368"><a href="#compute_subfeatures-368"><span class="linenos">368</span></a>    <span class="n">tmp_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">new_feature_hash</span><span class="p">)</span>
+</span><span id="compute_subfeatures-369"><a href="#compute_subfeatures-369"><span class="linenos">369</span></a>    <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">([</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">tmp_df</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="compute_subfeatures-370"><a href="#compute_subfeatures-370"><span class="linenos">370</span></a>
+</span><span id="compute_subfeatures-371"><a href="#compute_subfeatures-371"><span class="linenos">371</span></a>    <span class="k">del</span> <span class="n">tmp_df</span>
+</span><span id="compute_subfeatures-372"><a href="#compute_subfeatures-372"><span class="linenos">372</span></a>    <span class="k">return</span> <span class="n">input_dataframe</span>
 </span></pre></div>
 
 
@@ -1415,7 +1428,7 @@ <h1 class="modulename">
                 <section id="include_noisy_features">
                             <input id="include_noisy_features-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">include_noisy_features</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>,</span><span class="param">	<span class="n">logger</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">args</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>:</span></span>
 
@@ -1423,17 +1436,17 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#include_noisy_features"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="include_noisy_features-358"><a href="#include_noisy_features-358"><span class="linenos">358</span></a><span class="k">def</span> <span class="nf">include_noisy_features</span><span class="p">(</span>
-</span><span id="include_noisy_features-359"><a href="#include_noisy_features-359"><span class="linenos">359</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="include_noisy_features-360"><a href="#include_noisy_features-360"><span class="linenos">360</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="include_noisy_features-361"><a href="#include_noisy_features-361"><span class="linenos">361</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Add randomized features that serve as a sanity check&quot;&quot;&quot;</span>
-</span><span id="include_noisy_features-362"><a href="#include_noisy_features-362"><span class="linenos">362</span></a>
-</span><span id="include_noisy_features-363"><a href="#include_noisy_features-363"><span class="linenos">363</span></a>    <span class="n">transformer</span> <span class="o">=</span> <span class="n">FeatureTransformerNoise</span><span class="p">()</span>
-</span><span id="include_noisy_features-364"><a href="#include_noisy_features-364"><span class="linenos">364</span></a>    <span class="n">transformed_df</span> <span class="o">=</span> <span class="n">transformer</span><span class="o">.</span><span class="n">construct_new_features</span><span class="p">(</span>
-</span><span id="include_noisy_features-365"><a href="#include_noisy_features-365"><span class="linenos">365</span></a>        <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span><span class="p">,</span>
-</span><span id="include_noisy_features-366"><a href="#include_noisy_features-366"><span class="linenos">366</span></a>    <span class="p">)</span>
-</span><span id="include_noisy_features-367"><a href="#include_noisy_features-367"><span class="linenos">367</span></a>
-</span><span id="include_noisy_features-368"><a href="#include_noisy_features-368"><span class="linenos">368</span></a>    <span class="k">return</span> <span class="n">transformed_df</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="include_noisy_features-375"><a href="#include_noisy_features-375"><span class="linenos">375</span></a><span class="k">def</span> <span class="nf">include_noisy_features</span><span class="p">(</span>
+</span><span id="include_noisy_features-376"><a href="#include_noisy_features-376"><span class="linenos">376</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="include_noisy_features-377"><a href="#include_noisy_features-377"><span class="linenos">377</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="include_noisy_features-378"><a href="#include_noisy_features-378"><span class="linenos">378</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Add randomized features that serve as a sanity check&quot;&quot;&quot;</span>
+</span><span id="include_noisy_features-379"><a href="#include_noisy_features-379"><span class="linenos">379</span></a>
+</span><span id="include_noisy_features-380"><a href="#include_noisy_features-380"><span class="linenos">380</span></a>    <span class="n">transformer</span> <span class="o">=</span> <span class="n">FeatureTransformerNoise</span><span class="p">()</span>
+</span><span id="include_noisy_features-381"><a href="#include_noisy_features-381"><span class="linenos">381</span></a>    <span class="n">transformed_df</span> <span class="o">=</span> <span class="n">transformer</span><span class="o">.</span><span class="n">construct_new_features</span><span class="p">(</span>
+</span><span id="include_noisy_features-382"><a href="#include_noisy_features-382"><span class="linenos">382</span></a>        <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">label_column</span><span class="p">,</span>
+</span><span id="include_noisy_features-383"><a href="#include_noisy_features-383"><span class="linenos">383</span></a>    <span class="p">)</span>
+</span><span id="include_noisy_features-384"><a href="#include_noisy_features-384"><span class="linenos">384</span></a>
+</span><span id="include_noisy_features-385"><a href="#include_noisy_features-385"><span class="linenos">385</span></a>    <span class="k">return</span> <span class="n">transformed_df</span>
 </span></pre></div>
 
 
@@ -1445,7 +1458,7 @@ <h1 class="modulename">
                 <section id="compute_coverage">
                             <input id="compute_coverage-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">compute_coverage</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>,</span><span class="param">	<span class="n">args</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span>:</span></span>
 
@@ -1453,23 +1466,23 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#compute_coverage"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_coverage-371"><a href="#compute_coverage-371"><span class="linenos">371</span></a><span class="k">def</span> <span class="nf">compute_coverage</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
-</span><span id="compute_coverage-372"><a href="#compute_coverage-372"><span class="linenos">372</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute coverage of features, incrementally&quot;&quot;&quot;</span>
-</span><span id="compute_coverage-373"><a href="#compute_coverage-373"><span class="linenos">373</span></a>    <span class="n">output_storage_cov</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">set</span><span class="p">)</span>
-</span><span id="compute_coverage-374"><a href="#compute_coverage-374"><span class="linenos">374</span></a>    <span class="n">all_missing_symbols</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">missing_value_symbols</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))</span>
-</span><span id="compute_coverage-375"><a href="#compute_coverage-375"><span class="linenos">375</span></a>    <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="p">:</span>
-</span><span id="compute_coverage-376"><a href="#compute_coverage-376"><span class="linenos">376</span></a>        <span class="n">all_missing</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">(</span>
-</span><span id="compute_coverage-377"><a href="#compute_coverage-377"><span class="linenos">377</span></a>            <span class="p">[</span>
-</span><span id="compute_coverage-378"><a href="#compute_coverage-378"><span class="linenos">378</span></a>                <span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
-</span><span id="compute_coverage-379"><a href="#compute_coverage-379"><span class="linenos">379</span></a>                <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">all_missing_symbols</span>
-</span><span id="compute_coverage-380"><a href="#compute_coverage-380"><span class="linenos">380</span></a>            <span class="p">],</span>
-</span><span id="compute_coverage-381"><a href="#compute_coverage-381"><span class="linenos">381</span></a>        <span class="p">)</span>
-</span><span id="compute_coverage-382"><a href="#compute_coverage-382"><span class="linenos">382</span></a>
-</span><span id="compute_coverage-383"><a href="#compute_coverage-383"><span class="linenos">383</span></a>        <span class="n">output_storage_cov</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="compute_coverage-384"><a href="#compute_coverage-384"><span class="linenos">384</span></a>            <span class="mi">1</span> <span class="o">-</span> <span class="p">(</span><span class="n">all_missing</span> <span class="o">/</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
-</span><span id="compute_coverage-385"><a href="#compute_coverage-385"><span class="linenos">385</span></a>        <span class="p">)</span> <span class="o">*</span> <span class="mi">100</span>
-</span><span id="compute_coverage-386"><a href="#compute_coverage-386"><span class="linenos">386</span></a>
-</span><span id="compute_coverage-387"><a href="#compute_coverage-387"><span class="linenos">387</span></a>    <span class="k">return</span> <span class="n">output_storage_cov</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_coverage-388"><a href="#compute_coverage-388"><span class="linenos">388</span></a><span class="k">def</span> <span class="nf">compute_coverage</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
+</span><span id="compute_coverage-389"><a href="#compute_coverage-389"><span class="linenos">389</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute coverage of features, incrementally&quot;&quot;&quot;</span>
+</span><span id="compute_coverage-390"><a href="#compute_coverage-390"><span class="linenos">390</span></a>    <span class="n">output_storage_cov</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">set</span><span class="p">)</span>
+</span><span id="compute_coverage-391"><a href="#compute_coverage-391"><span class="linenos">391</span></a>    <span class="n">all_missing_symbols</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">missing_value_symbols</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))</span>
+</span><span id="compute_coverage-392"><a href="#compute_coverage-392"><span class="linenos">392</span></a>    <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="p">:</span>
+</span><span id="compute_coverage-393"><a href="#compute_coverage-393"><span class="linenos">393</span></a>        <span class="n">all_missing</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">(</span>
+</span><span id="compute_coverage-394"><a href="#compute_coverage-394"><span class="linenos">394</span></a>            <span class="p">[</span>
+</span><span id="compute_coverage-395"><a href="#compute_coverage-395"><span class="linenos">395</span></a>                <span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="compute_coverage-396"><a href="#compute_coverage-396"><span class="linenos">396</span></a>                <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">all_missing_symbols</span>
+</span><span id="compute_coverage-397"><a href="#compute_coverage-397"><span class="linenos">397</span></a>            <span class="p">],</span>
+</span><span id="compute_coverage-398"><a href="#compute_coverage-398"><span class="linenos">398</span></a>        <span class="p">)</span>
+</span><span id="compute_coverage-399"><a href="#compute_coverage-399"><span class="linenos">399</span></a>
+</span><span id="compute_coverage-400"><a href="#compute_coverage-400"><span class="linenos">400</span></a>        <span class="n">output_storage_cov</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="compute_coverage-401"><a href="#compute_coverage-401"><span class="linenos">401</span></a>            <span class="mi">1</span> <span class="o">-</span> <span class="p">(</span><span class="n">all_missing</span> <span class="o">/</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="compute_coverage-402"><a href="#compute_coverage-402"><span class="linenos">402</span></a>        <span class="p">)</span> <span class="o">*</span> <span class="mi">100</span>
+</span><span id="compute_coverage-403"><a href="#compute_coverage-403"><span class="linenos">403</span></a>
+</span><span id="compute_coverage-404"><a href="#compute_coverage-404"><span class="linenos">404</span></a>    <span class="k">return</span> <span class="n">output_storage_cov</span>
 </span></pre></div>
 
 
@@ -1481,7 +1494,7 @@ <h1 class="modulename">
                 <section id="compute_feature_memory_consumption">
                             <input id="compute_feature_memory_consumption-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">compute_feature_memory_consumption</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>,</span><span class="param">	<span class="n">args</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span>:</span></span>
 
@@ -1489,19 +1502,19 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#compute_feature_memory_consumption"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_feature_memory_consumption-390"><a href="#compute_feature_memory_consumption-390"><span class="linenos">390</span></a><span class="k">def</span> <span class="nf">compute_feature_memory_consumption</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
-</span><span id="compute_feature_memory_consumption-391"><a href="#compute_feature_memory_consumption-391"><span class="linenos">391</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;An approximation of how much feature take up&quot;&quot;&quot;</span>
-</span><span id="compute_feature_memory_consumption-392"><a href="#compute_feature_memory_consumption-392"><span class="linenos">392</span></a>    <span class="n">output_storage_features</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">set</span><span class="p">)</span>
-</span><span id="compute_feature_memory_consumption-393"><a href="#compute_feature_memory_consumption-393"><span class="linenos">393</span></a>    <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
-</span><span id="compute_feature_memory_consumption-394"><a href="#compute_feature_memory_consumption-394"><span class="linenos">394</span></a>        <span class="n">specific_column</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="compute_feature_memory_consumption-395"><a href="#compute_feature_memory_consumption-395"><span class="linenos">395</span></a>            <span class="nb">str</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">col</span><span class="p">]</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">str</span><span class="p">)</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="compute_feature_memory_consumption-396"><a href="#compute_feature_memory_consumption-396"><span class="linenos">396</span></a>        <span class="p">]</span>
-</span><span id="compute_feature_memory_consumption-397"><a href="#compute_feature_memory_consumption-397"><span class="linenos">397</span></a>        <span class="n">col_size</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">(</span>
-</span><span id="compute_feature_memory_consumption-398"><a href="#compute_feature_memory_consumption-398"><span class="linenos">398</span></a>            <span class="nb">len</span><span class="p">(</span><span class="n">x</span><span class="o">.</span><span class="n">encode</span><span class="p">())</span>
-</span><span id="compute_feature_memory_consumption-399"><a href="#compute_feature_memory_consumption-399"><span class="linenos">399</span></a>            <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">specific_column</span>
-</span><span id="compute_feature_memory_consumption-400"><a href="#compute_feature_memory_consumption-400"><span class="linenos">400</span></a>        <span class="p">)</span> <span class="o">/</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="compute_feature_memory_consumption-401"><a href="#compute_feature_memory_consumption-401"><span class="linenos">401</span></a>        <span class="n">output_storage_features</span><span class="p">[</span><span class="n">col</span><span class="p">]</span> <span class="o">=</span> <span class="n">col_size</span>
-</span><span id="compute_feature_memory_consumption-402"><a href="#compute_feature_memory_consumption-402"><span class="linenos">402</span></a>    <span class="k">return</span> <span class="n">output_storage_features</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_feature_memory_consumption-407"><a href="#compute_feature_memory_consumption-407"><span class="linenos">407</span></a><span class="k">def</span> <span class="nf">compute_feature_memory_consumption</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]:</span>
+</span><span id="compute_feature_memory_consumption-408"><a href="#compute_feature_memory_consumption-408"><span class="linenos">408</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;An approximation of how much feature take up&quot;&quot;&quot;</span>
+</span><span id="compute_feature_memory_consumption-409"><a href="#compute_feature_memory_consumption-409"><span class="linenos">409</span></a>    <span class="n">output_storage_features</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">set</span><span class="p">)</span>
+</span><span id="compute_feature_memory_consumption-410"><a href="#compute_feature_memory_consumption-410"><span class="linenos">410</span></a>    <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
+</span><span id="compute_feature_memory_consumption-411"><a href="#compute_feature_memory_consumption-411"><span class="linenos">411</span></a>        <span class="n">specific_column</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="compute_feature_memory_consumption-412"><a href="#compute_feature_memory_consumption-412"><span class="linenos">412</span></a>            <span class="nb">str</span><span class="p">(</span><span class="n">x</span><span class="p">)</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">col</span><span class="p">]</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">str</span><span class="p">)</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="compute_feature_memory_consumption-413"><a href="#compute_feature_memory_consumption-413"><span class="linenos">413</span></a>        <span class="p">]</span>
+</span><span id="compute_feature_memory_consumption-414"><a href="#compute_feature_memory_consumption-414"><span class="linenos">414</span></a>        <span class="n">col_size</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">(</span>
+</span><span id="compute_feature_memory_consumption-415"><a href="#compute_feature_memory_consumption-415"><span class="linenos">415</span></a>            <span class="nb">len</span><span class="p">(</span><span class="n">x</span><span class="o">.</span><span class="n">encode</span><span class="p">())</span>
+</span><span id="compute_feature_memory_consumption-416"><a href="#compute_feature_memory_consumption-416"><span class="linenos">416</span></a>            <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">specific_column</span>
+</span><span id="compute_feature_memory_consumption-417"><a href="#compute_feature_memory_consumption-417"><span class="linenos">417</span></a>        <span class="p">)</span> <span class="o">/</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="compute_feature_memory_consumption-418"><a href="#compute_feature_memory_consumption-418"><span class="linenos">418</span></a>        <span class="n">output_storage_features</span><span class="p">[</span><span class="n">col</span><span class="p">]</span> <span class="o">=</span> <span class="n">col_size</span>
+</span><span id="compute_feature_memory_consumption-419"><a href="#compute_feature_memory_consumption-419"><span class="linenos">419</span></a>    <span class="k">return</span> <span class="n">output_storage_features</span>
 </span></pre></div>
 
 
@@ -1513,7 +1526,7 @@ <h1 class="modulename">
                 <section id="compute_value_counts">
                             <input id="compute_value_counts-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">compute_value_counts</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>, </span><span class="param"><span class="n">args</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">):</span></span>
 
@@ -1521,24 +1534,24 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#compute_value_counts"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_value_counts-405"><a href="#compute_value_counts-405"><span class="linenos">405</span></a><span class="k">def</span> <span class="nf">compute_value_counts</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">):</span>
-</span><span id="compute_value_counts-406"><a href="#compute_value_counts-406"><span class="linenos">406</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Update the count structure&quot;&quot;&quot;</span>
-</span><span id="compute_value_counts-407"><a href="#compute_value_counts-407"><span class="linenos">407</span></a>
-</span><span id="compute_value_counts-408"><a href="#compute_value_counts-408"><span class="linenos">408</span></a>    <span class="k">global</span> <span class="n">GLOBAL_RARE_VALUE_STORAGE</span>
-</span><span id="compute_value_counts-409"><a href="#compute_value_counts-409"><span class="linenos">409</span></a>    <span class="k">global</span> <span class="n">IGNORED_VALUES</span>
-</span><span id="compute_value_counts-410"><a href="#compute_value_counts-410"><span class="linenos">410</span></a>
-</span><span id="compute_value_counts-411"><a href="#compute_value_counts-411"><span class="linenos">411</span></a>    <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
-</span><span id="compute_value_counts-412"><a href="#compute_value_counts-412"><span class="linenos">412</span></a>        <span class="n">main_values</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
-</span><span id="compute_value_counts-413"><a href="#compute_value_counts-413"><span class="linenos">413</span></a>        <span class="k">for</span> <span class="n">value</span> <span class="ow">in</span> <span class="n">main_values</span><span class="p">:</span>
-</span><span id="compute_value_counts-414"><a href="#compute_value_counts-414"><span class="linenos">414</span></a>            <span class="k">if</span> <span class="n">value</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">IGNORED_VALUES</span><span class="p">:</span>
-</span><span id="compute_value_counts-415"><a href="#compute_value_counts-415"><span class="linenos">415</span></a>                <span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="o">.</span><span class="n">update</span><span class="p">({(</span><span class="n">column</span><span class="p">,</span> <span class="n">value</span><span class="p">):</span> <span class="mi">1</span><span class="p">})</span>
-</span><span id="compute_value_counts-416"><a href="#compute_value_counts-416"><span class="linenos">416</span></a>
-</span><span id="compute_value_counts-417"><a href="#compute_value_counts-417"><span class="linenos">417</span></a>    <span class="k">for</span> <span class="n">key</span><span class="p">,</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="compute_value_counts-418"><a href="#compute_value_counts-418"><span class="linenos">418</span></a>        <span class="k">if</span> <span class="n">val</span> <span class="o">&gt;</span> <span class="n">args</span><span class="o">.</span><span class="n">rare_value_count_upper_bound</span><span class="p">:</span>
-</span><span id="compute_value_counts-419"><a href="#compute_value_counts-419"><span class="linenos">419</span></a>            <span class="n">IGNORED_VALUES</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">key</span><span class="p">)</span>
-</span><span id="compute_value_counts-420"><a href="#compute_value_counts-420"><span class="linenos">420</span></a>
-</span><span id="compute_value_counts-421"><a href="#compute_value_counts-421"><span class="linenos">421</span></a>    <span class="k">for</span> <span class="n">to_remove_val</span> <span class="ow">in</span> <span class="n">IGNORED_VALUES</span><span class="p">:</span>
-</span><span id="compute_value_counts-422"><a href="#compute_value_counts-422"><span class="linenos">422</span></a>        <span class="k">del</span> <span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="p">[</span><span class="n">to_remove_val</span><span class="p">]</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_value_counts-422"><a href="#compute_value_counts-422"><span class="linenos">422</span></a><span class="k">def</span> <span class="nf">compute_value_counts</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">):</span>
+</span><span id="compute_value_counts-423"><a href="#compute_value_counts-423"><span class="linenos">423</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Update the count structure&quot;&quot;&quot;</span>
+</span><span id="compute_value_counts-424"><a href="#compute_value_counts-424"><span class="linenos">424</span></a>
+</span><span id="compute_value_counts-425"><a href="#compute_value_counts-425"><span class="linenos">425</span></a>    <span class="k">global</span> <span class="n">GLOBAL_RARE_VALUE_STORAGE</span>
+</span><span id="compute_value_counts-426"><a href="#compute_value_counts-426"><span class="linenos">426</span></a>    <span class="k">global</span> <span class="n">IGNORED_VALUES</span>
+</span><span id="compute_value_counts-427"><a href="#compute_value_counts-427"><span class="linenos">427</span></a>
+</span><span id="compute_value_counts-428"><a href="#compute_value_counts-428"><span class="linenos">428</span></a>    <span class="k">for</span> <span class="n">column</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
+</span><span id="compute_value_counts-429"><a href="#compute_value_counts-429"><span class="linenos">429</span></a>        <span class="n">main_values</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
+</span><span id="compute_value_counts-430"><a href="#compute_value_counts-430"><span class="linenos">430</span></a>        <span class="k">for</span> <span class="n">value</span> <span class="ow">in</span> <span class="n">main_values</span><span class="p">:</span>
+</span><span id="compute_value_counts-431"><a href="#compute_value_counts-431"><span class="linenos">431</span></a>            <span class="k">if</span> <span class="n">value</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">IGNORED_VALUES</span><span class="p">:</span>
+</span><span id="compute_value_counts-432"><a href="#compute_value_counts-432"><span class="linenos">432</span></a>                <span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="o">.</span><span class="n">update</span><span class="p">({(</span><span class="n">column</span><span class="p">,</span> <span class="n">value</span><span class="p">):</span> <span class="mi">1</span><span class="p">})</span>
+</span><span id="compute_value_counts-433"><a href="#compute_value_counts-433"><span class="linenos">433</span></a>
+</span><span id="compute_value_counts-434"><a href="#compute_value_counts-434"><span class="linenos">434</span></a>    <span class="k">for</span> <span class="n">key</span><span class="p">,</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="compute_value_counts-435"><a href="#compute_value_counts-435"><span class="linenos">435</span></a>        <span class="k">if</span> <span class="n">val</span> <span class="o">&gt;</span> <span class="n">args</span><span class="o">.</span><span class="n">rare_value_count_upper_bound</span><span class="p">:</span>
+</span><span id="compute_value_counts-436"><a href="#compute_value_counts-436"><span class="linenos">436</span></a>            <span class="n">IGNORED_VALUES</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">key</span><span class="p">)</span>
+</span><span id="compute_value_counts-437"><a href="#compute_value_counts-437"><span class="linenos">437</span></a>
+</span><span id="compute_value_counts-438"><a href="#compute_value_counts-438"><span class="linenos">438</span></a>    <span class="k">for</span> <span class="n">to_remove_val</span> <span class="ow">in</span> <span class="n">IGNORED_VALUES</span><span class="p">:</span>
+</span><span id="compute_value_counts-439"><a href="#compute_value_counts-439"><span class="linenos">439</span></a>        <span class="k">del</span> <span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="p">[</span><span class="n">to_remove_val</span><span class="p">]</span>
 </span></pre></div>
 
 
@@ -1550,7 +1563,7 @@ <h1 class="modulename">
                 <section id="compute_cardinalities">
                             <input id="compute_cardinalities-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">compute_cardinalities</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>,</span><span class="param">	<span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">max_unique_hist_constraint</span><span class="p">:</span> <span class="nb">int</span></span><span class="return-annotation">) -> <span class="kc">None</span>:</span></span>
 
@@ -1558,32 +1571,32 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#compute_cardinalities"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_cardinalities-425"><a href="#compute_cardinalities-425"><span class="linenos">425</span></a><span class="k">def</span> <span class="nf">compute_cardinalities</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">max_unique_hist_constraint</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="compute_cardinalities-426"><a href="#compute_cardinalities-426"><span class="linenos">426</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute cardinalities of features, incrementally&quot;&quot;&quot;</span>
-</span><span id="compute_cardinalities-427"><a href="#compute_cardinalities-427"><span class="linenos">427</span></a>
-</span><span id="compute_cardinalities-428"><a href="#compute_cardinalities-428"><span class="linenos">428</span></a>    <span class="k">global</span> <span class="n">GLOBAL_CARDINALITY_STORAGE</span>
-</span><span id="compute_cardinalities-429"><a href="#compute_cardinalities-429"><span class="linenos">429</span></a>    <span class="n">output_storage_card</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">set</span><span class="p">)</span>
-</span><span id="compute_cardinalities-430"><a href="#compute_cardinalities-430"><span class="linenos">430</span></a>    <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">column</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">):</span>
-</span><span id="compute_cardinalities-431"><a href="#compute_cardinalities-431"><span class="linenos">431</span></a>        <span class="n">output_storage_card</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">unique</span><span class="p">())</span>
-</span><span id="compute_cardinalities-432"><a href="#compute_cardinalities-432"><span class="linenos">432</span></a>        <span class="k">if</span> <span class="n">column</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="p">:</span>
-</span><span id="compute_cardinalities-433"><a href="#compute_cardinalities-433"><span class="linenos">433</span></a>            <span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="n">HyperLogLog</span><span class="p">(</span>
-</span><span id="compute_cardinalities-434"><a href="#compute_cardinalities-434"><span class="linenos">434</span></a>                <span class="n">HYPERLL_ERROR_BOUND</span><span class="p">,</span>
-</span><span id="compute_cardinalities-435"><a href="#compute_cardinalities-435"><span class="linenos">435</span></a>            <span class="p">)</span>
-</span><span id="compute_cardinalities-436"><a href="#compute_cardinalities-436"><span class="linenos">436</span></a>
-</span><span id="compute_cardinalities-437"><a href="#compute_cardinalities-437"><span class="linenos">437</span></a>        <span class="k">if</span> <span class="n">column</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">GLOBAL_COUNTS_STORAGE</span><span class="p">:</span>
-</span><span id="compute_cardinalities-438"><a href="#compute_cardinalities-438"><span class="linenos">438</span></a>            <span class="n">GLOBAL_COUNTS_STORAGE</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="n">PrimitiveConstrainedCounter</span><span class="p">(</span><span class="n">max_unique_hist_constraint</span><span class="p">)</span>
-</span><span id="compute_cardinalities-439"><a href="#compute_cardinalities-439"><span class="linenos">439</span></a>
-</span><span id="compute_cardinalities-440"><a href="#compute_cardinalities-440"><span class="linenos">440</span></a>        <span class="p">[</span><span class="n">GLOBAL_COUNTS_STORAGE</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">value</span><span class="p">)</span> <span class="k">for</span> <span class="n">value</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">]</span>
-</span><span id="compute_cardinalities-441"><a href="#compute_cardinalities-441"><span class="linenos">441</span></a>
-</span><span id="compute_cardinalities-442"><a href="#compute_cardinalities-442"><span class="linenos">442</span></a>        <span class="k">for</span> <span class="n">unique_value</span> <span class="ow">in</span> <span class="nb">set</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">unique</span><span class="p">()):</span>
-</span><span id="compute_cardinalities-443"><a href="#compute_cardinalities-443"><span class="linenos">443</span></a>            <span class="k">if</span> <span class="n">unique_value</span><span class="p">:</span>
-</span><span id="compute_cardinalities-444"><a href="#compute_cardinalities-444"><span class="linenos">444</span></a>                <span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">add</span><span class="p">(</span>
-</span><span id="compute_cardinalities-445"><a href="#compute_cardinalities-445"><span class="linenos">445</span></a>                    <span class="n">internal_hash</span><span class="p">(</span><span class="n">unique_value</span><span class="p">),</span>
-</span><span id="compute_cardinalities-446"><a href="#compute_cardinalities-446"><span class="linenos">446</span></a>                <span class="p">)</span>
-</span><span id="compute_cardinalities-447"><a href="#compute_cardinalities-447"><span class="linenos">447</span></a>
-</span><span id="compute_cardinalities-448"><a href="#compute_cardinalities-448"><span class="linenos">448</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span>
-</span><span id="compute_cardinalities-449"><a href="#compute_cardinalities-449"><span class="linenos">449</span></a>            <span class="sa">f</span><span class="s1">&#39;Computing cardinality (Hyperloglog update) </span><span class="si">{</span><span class="n">enx</span><span class="si">}</span><span class="s1">/</span><span class="si">{</span><span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="compute_cardinalities-450"><a href="#compute_cardinalities-450"><span class="linenos">450</span></a>        <span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_cardinalities-442"><a href="#compute_cardinalities-442"><span class="linenos">442</span></a><span class="k">def</span> <span class="nf">compute_cardinalities</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">max_unique_hist_constraint</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="compute_cardinalities-443"><a href="#compute_cardinalities-443"><span class="linenos">443</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute cardinalities of features, incrementally&quot;&quot;&quot;</span>
+</span><span id="compute_cardinalities-444"><a href="#compute_cardinalities-444"><span class="linenos">444</span></a>
+</span><span id="compute_cardinalities-445"><a href="#compute_cardinalities-445"><span class="linenos">445</span></a>    <span class="k">global</span> <span class="n">GLOBAL_CARDINALITY_STORAGE</span>
+</span><span id="compute_cardinalities-446"><a href="#compute_cardinalities-446"><span class="linenos">446</span></a>    <span class="n">output_storage_card</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">set</span><span class="p">)</span>
+</span><span id="compute_cardinalities-447"><a href="#compute_cardinalities-447"><span class="linenos">447</span></a>    <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">column</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">):</span>
+</span><span id="compute_cardinalities-448"><a href="#compute_cardinalities-448"><span class="linenos">448</span></a>        <span class="n">output_storage_card</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">unique</span><span class="p">())</span>
+</span><span id="compute_cardinalities-449"><a href="#compute_cardinalities-449"><span class="linenos">449</span></a>        <span class="k">if</span> <span class="n">column</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="p">:</span>
+</span><span id="compute_cardinalities-450"><a href="#compute_cardinalities-450"><span class="linenos">450</span></a>            <span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="n">HyperLogLog</span><span class="p">(</span>
+</span><span id="compute_cardinalities-451"><a href="#compute_cardinalities-451"><span class="linenos">451</span></a>                <span class="n">HYPERLL_ERROR_BOUND</span><span class="p">,</span>
+</span><span id="compute_cardinalities-452"><a href="#compute_cardinalities-452"><span class="linenos">452</span></a>            <span class="p">)</span>
+</span><span id="compute_cardinalities-453"><a href="#compute_cardinalities-453"><span class="linenos">453</span></a>
+</span><span id="compute_cardinalities-454"><a href="#compute_cardinalities-454"><span class="linenos">454</span></a>        <span class="k">if</span> <span class="n">column</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">GLOBAL_COUNTS_STORAGE</span><span class="p">:</span>
+</span><span id="compute_cardinalities-455"><a href="#compute_cardinalities-455"><span class="linenos">455</span></a>            <span class="n">GLOBAL_COUNTS_STORAGE</span><span class="p">[</span><span class="n">column</span><span class="p">]</span> <span class="o">=</span> <span class="n">PrimitiveConstrainedCounter</span><span class="p">(</span><span class="n">max_unique_hist_constraint</span><span class="p">)</span>
+</span><span id="compute_cardinalities-456"><a href="#compute_cardinalities-456"><span class="linenos">456</span></a>
+</span><span id="compute_cardinalities-457"><a href="#compute_cardinalities-457"><span class="linenos">457</span></a>        <span class="p">[</span><span class="n">GLOBAL_COUNTS_STORAGE</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">value</span><span class="p">)</span> <span class="k">for</span> <span class="n">value</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">]</span>
+</span><span id="compute_cardinalities-458"><a href="#compute_cardinalities-458"><span class="linenos">458</span></a>
+</span><span id="compute_cardinalities-459"><a href="#compute_cardinalities-459"><span class="linenos">459</span></a>        <span class="k">for</span> <span class="n">unique_value</span> <span class="ow">in</span> <span class="nb">set</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">unique</span><span class="p">()):</span>
+</span><span id="compute_cardinalities-460"><a href="#compute_cardinalities-460"><span class="linenos">460</span></a>            <span class="k">if</span> <span class="n">unique_value</span><span class="p">:</span>
+</span><span id="compute_cardinalities-461"><a href="#compute_cardinalities-461"><span class="linenos">461</span></a>                <span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="p">[</span><span class="n">column</span><span class="p">]</span><span class="o">.</span><span class="n">add</span><span class="p">(</span>
+</span><span id="compute_cardinalities-462"><a href="#compute_cardinalities-462"><span class="linenos">462</span></a>                    <span class="n">internal_hash</span><span class="p">(</span><span class="n">unique_value</span><span class="p">),</span>
+</span><span id="compute_cardinalities-463"><a href="#compute_cardinalities-463"><span class="linenos">463</span></a>                <span class="p">)</span>
+</span><span id="compute_cardinalities-464"><a href="#compute_cardinalities-464"><span class="linenos">464</span></a>
+</span><span id="compute_cardinalities-465"><a href="#compute_cardinalities-465"><span class="linenos">465</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span>
+</span><span id="compute_cardinalities-466"><a href="#compute_cardinalities-466"><span class="linenos">466</span></a>            <span class="sa">f</span><span class="s1">&#39;Computing cardinality (Hyperloglog update) </span><span class="si">{</span><span class="n">enx</span><span class="si">}</span><span class="s1">/</span><span class="si">{</span><span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="compute_cardinalities-467"><a href="#compute_cardinalities-467"><span class="linenos">467</span></a>        <span class="p">)</span>
 </span></pre></div>
 
 
@@ -1595,7 +1608,7 @@ <h1 class="modulename">
                 <section id="compute_bounds_increment">
                             <input id="compute_bounds_increment-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">compute_bounds_increment</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>,</span><span class="param">	<span class="n">numeric_column_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">]</span>:</span></span>
 
@@ -1603,46 +1616,46 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#compute_bounds_increment"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_bounds_increment-453"><a href="#compute_bounds_increment-453"><span class="linenos">453</span></a><span class="k">def</span> <span class="nf">compute_bounds_increment</span><span class="p">(</span>
-</span><span id="compute_bounds_increment-454"><a href="#compute_bounds_increment-454"><span class="linenos">454</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">numeric_column_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
-</span><span id="compute_bounds_increment-455"><a href="#compute_bounds_increment-455"><span class="linenos">455</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]:</span>
-</span><span id="compute_bounds_increment-456"><a href="#compute_bounds_increment-456"><span class="linenos">456</span></a>    <span class="n">all_features</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span>
-</span><span id="compute_bounds_increment-457"><a href="#compute_bounds_increment-457"><span class="linenos">457</span></a>    <span class="n">numeric_column_types</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">numeric_column_types</span><span class="p">)</span>
-</span><span id="compute_bounds_increment-458"><a href="#compute_bounds_increment-458"><span class="linenos">458</span></a>    <span class="n">summary_object</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="compute_bounds_increment-459"><a href="#compute_bounds_increment-459"><span class="linenos">459</span></a>    <span class="n">summary_storage</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="compute_bounds_increment-460"><a href="#compute_bounds_increment-460"><span class="linenos">460</span></a>    <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">all_features</span><span class="p">:</span>
-</span><span id="compute_bounds_increment-461"><a href="#compute_bounds_increment-461"><span class="linenos">461</span></a>        <span class="k">if</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">numeric_column_types</span><span class="p">:</span>
-</span><span id="compute_bounds_increment-462"><a href="#compute_bounds_increment-462"><span class="linenos">462</span></a>            <span class="n">feature_vector</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">to_numeric</span><span class="p">(</span>
-</span><span id="compute_bounds_increment-463"><a href="#compute_bounds_increment-463"><span class="linenos">463</span></a>                <span class="n">input_dataframe</span><span class="p">[</span><span class="n">feature</span><span class="p">],</span> <span class="n">errors</span><span class="o">=</span><span class="s1">&#39;coerce&#39;</span><span class="p">,</span>
-</span><span id="compute_bounds_increment-464"><a href="#compute_bounds_increment-464"><span class="linenos">464</span></a>            <span class="p">)</span>
-</span><span id="compute_bounds_increment-465"><a href="#compute_bounds_increment-465"><span class="linenos">465</span></a>            <span class="n">minimum</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">)</span>
-</span><span id="compute_bounds_increment-466"><a href="#compute_bounds_increment-466"><span class="linenos">466</span></a>            <span class="n">maximum</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">)</span>
-</span><span id="compute_bounds_increment-467"><a href="#compute_bounds_increment-467"><span class="linenos">467</span></a>            <span class="n">mean</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">)</span>
-</span><span id="compute_bounds_increment-468"><a href="#compute_bounds_increment-468"><span class="linenos">468</span></a>            <span class="n">summary_storage</span> <span class="o">=</span> <span class="n">NumericFeatureSummary</span><span class="p">(</span>
-</span><span id="compute_bounds_increment-469"><a href="#compute_bounds_increment-469"><span class="linenos">469</span></a>                <span class="n">feature</span><span class="p">,</span> <span class="n">minimum</span><span class="p">,</span> <span class="n">maximum</span><span class="p">,</span> <span class="n">mean</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span>
-</span><span id="compute_bounds_increment-470"><a href="#compute_bounds_increment-470"><span class="linenos">470</span></a>                    <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">),</span>
-</span><span id="compute_bounds_increment-471"><a href="#compute_bounds_increment-471"><span class="linenos">471</span></a>                <span class="p">),</span>
-</span><span id="compute_bounds_increment-472"><a href="#compute_bounds_increment-472"><span class="linenos">472</span></a>            <span class="p">)</span>
-</span><span id="compute_bounds_increment-473"><a href="#compute_bounds_increment-473"><span class="linenos">473</span></a>            <span class="n">summary_object</span><span class="p">[</span><span class="n">feature</span><span class="p">]</span> <span class="o">=</span> <span class="n">summary_storage</span>
-</span><span id="compute_bounds_increment-474"><a href="#compute_bounds_increment-474"><span class="linenos">474</span></a>
-</span><span id="compute_bounds_increment-475"><a href="#compute_bounds_increment-475"><span class="linenos">475</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="compute_bounds_increment-476"><a href="#compute_bounds_increment-476"><span class="linenos">476</span></a>            <span class="n">feature_vector</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">feature</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
-</span><span id="compute_bounds_increment-477"><a href="#compute_bounds_increment-477"><span class="linenos">477</span></a>            <span class="n">summary_storage</span> <span class="o">=</span> <span class="n">NominalFeatureSummary</span><span class="p">(</span>
-</span><span id="compute_bounds_increment-478"><a href="#compute_bounds_increment-478"><span class="linenos">478</span></a>                <span class="n">feature</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">)),</span>
-</span><span id="compute_bounds_increment-479"><a href="#compute_bounds_increment-479"><span class="linenos">479</span></a>            <span class="p">)</span>
-</span><span id="compute_bounds_increment-480"><a href="#compute_bounds_increment-480"><span class="linenos">480</span></a>            <span class="n">summary_object</span><span class="p">[</span><span class="n">feature</span><span class="p">]</span> <span class="o">=</span> <span class="n">summary_storage</span>
-</span><span id="compute_bounds_increment-481"><a href="#compute_bounds_increment-481"><span class="linenos">481</span></a>
-</span><span id="compute_bounds_increment-482"><a href="#compute_bounds_increment-482"><span class="linenos">482</span></a>    <span class="k">return</span> <span class="n">summary_object</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_bounds_increment-470"><a href="#compute_bounds_increment-470"><span class="linenos">470</span></a><span class="k">def</span> <span class="nf">compute_bounds_increment</span><span class="p">(</span>
+</span><span id="compute_bounds_increment-471"><a href="#compute_bounds_increment-471"><span class="linenos">471</span></a>    <span class="n">input_dataframe</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">,</span> <span class="n">numeric_column_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
+</span><span id="compute_bounds_increment-472"><a href="#compute_bounds_increment-472"><span class="linenos">472</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]:</span>
+</span><span id="compute_bounds_increment-473"><a href="#compute_bounds_increment-473"><span class="linenos">473</span></a>    <span class="n">all_features</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span>
+</span><span id="compute_bounds_increment-474"><a href="#compute_bounds_increment-474"><span class="linenos">474</span></a>    <span class="n">numeric_column_types</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">numeric_column_types</span><span class="p">)</span>
+</span><span id="compute_bounds_increment-475"><a href="#compute_bounds_increment-475"><span class="linenos">475</span></a>    <span class="n">summary_object</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="compute_bounds_increment-476"><a href="#compute_bounds_increment-476"><span class="linenos">476</span></a>    <span class="n">summary_storage</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="compute_bounds_increment-477"><a href="#compute_bounds_increment-477"><span class="linenos">477</span></a>    <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">all_features</span><span class="p">:</span>
+</span><span id="compute_bounds_increment-478"><a href="#compute_bounds_increment-478"><span class="linenos">478</span></a>        <span class="k">if</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">numeric_column_types</span><span class="p">:</span>
+</span><span id="compute_bounds_increment-479"><a href="#compute_bounds_increment-479"><span class="linenos">479</span></a>            <span class="n">feature_vector</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">to_numeric</span><span class="p">(</span>
+</span><span id="compute_bounds_increment-480"><a href="#compute_bounds_increment-480"><span class="linenos">480</span></a>                <span class="n">input_dataframe</span><span class="p">[</span><span class="n">feature</span><span class="p">],</span> <span class="n">errors</span><span class="o">=</span><span class="s1">&#39;coerce&#39;</span><span class="p">,</span>
+</span><span id="compute_bounds_increment-481"><a href="#compute_bounds_increment-481"><span class="linenos">481</span></a>            <span class="p">)</span>
+</span><span id="compute_bounds_increment-482"><a href="#compute_bounds_increment-482"><span class="linenos">482</span></a>            <span class="n">minimum</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">)</span>
+</span><span id="compute_bounds_increment-483"><a href="#compute_bounds_increment-483"><span class="linenos">483</span></a>            <span class="n">maximum</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">)</span>
+</span><span id="compute_bounds_increment-484"><a href="#compute_bounds_increment-484"><span class="linenos">484</span></a>            <span class="n">mean</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">)</span>
+</span><span id="compute_bounds_increment-485"><a href="#compute_bounds_increment-485"><span class="linenos">485</span></a>            <span class="n">summary_storage</span> <span class="o">=</span> <span class="n">NumericFeatureSummary</span><span class="p">(</span>
+</span><span id="compute_bounds_increment-486"><a href="#compute_bounds_increment-486"><span class="linenos">486</span></a>                <span class="n">feature</span><span class="p">,</span> <span class="n">minimum</span><span class="p">,</span> <span class="n">maximum</span><span class="p">,</span> <span class="n">mean</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span>
+</span><span id="compute_bounds_increment-487"><a href="#compute_bounds_increment-487"><span class="linenos">487</span></a>                    <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">),</span>
+</span><span id="compute_bounds_increment-488"><a href="#compute_bounds_increment-488"><span class="linenos">488</span></a>                <span class="p">),</span>
+</span><span id="compute_bounds_increment-489"><a href="#compute_bounds_increment-489"><span class="linenos">489</span></a>            <span class="p">)</span>
+</span><span id="compute_bounds_increment-490"><a href="#compute_bounds_increment-490"><span class="linenos">490</span></a>            <span class="n">summary_object</span><span class="p">[</span><span class="n">feature</span><span class="p">]</span> <span class="o">=</span> <span class="n">summary_storage</span>
+</span><span id="compute_bounds_increment-491"><a href="#compute_bounds_increment-491"><span class="linenos">491</span></a>
+</span><span id="compute_bounds_increment-492"><a href="#compute_bounds_increment-492"><span class="linenos">492</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="compute_bounds_increment-493"><a href="#compute_bounds_increment-493"><span class="linenos">493</span></a>            <span class="n">feature_vector</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="n">feature</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
+</span><span id="compute_bounds_increment-494"><a href="#compute_bounds_increment-494"><span class="linenos">494</span></a>            <span class="n">summary_storage</span> <span class="o">=</span> <span class="n">NominalFeatureSummary</span><span class="p">(</span>
+</span><span id="compute_bounds_increment-495"><a href="#compute_bounds_increment-495"><span class="linenos">495</span></a>                <span class="n">feature</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature_vector</span><span class="p">)),</span>
+</span><span id="compute_bounds_increment-496"><a href="#compute_bounds_increment-496"><span class="linenos">496</span></a>            <span class="p">)</span>
+</span><span id="compute_bounds_increment-497"><a href="#compute_bounds_increment-497"><span class="linenos">497</span></a>            <span class="n">summary_object</span><span class="p">[</span><span class="n">feature</span><span class="p">]</span> <span class="o">=</span> <span class="n">summary_storage</span>
+</span><span id="compute_bounds_increment-498"><a href="#compute_bounds_increment-498"><span class="linenos">498</span></a>
+</span><span id="compute_bounds_increment-499"><a href="#compute_bounds_increment-499"><span class="linenos">499</span></a>    <span class="k">return</span> <span class="n">summary_object</span>
 </span></pre></div>
 
 
-
+    
 
                 </section>
                 <section id="compute_batch_ranking">
                             <input id="compute_batch_ranking-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">compute_batch_ranking</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">line_tmp_storage</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">]]</span>,</span><span class="param">	<span class="n">numeric_column_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span>,</span><span class="param">	<span class="n">args</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">cpu_pool</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">column_descriptions</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span>,</span><span class="param">	<span class="n">logger</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="nb">tuple</span><span class="p">[</span><span class="n"><a href="core_utils.html#BatchRankingSummary">outrank.core_utils.BatchRankingSummary</a></span><span class="p">,</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]]</span>:</span></span>
 
@@ -1650,97 +1663,97 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#compute_batch_ranking"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_batch_ranking-485"><a href="#compute_batch_ranking-485"><span class="linenos">485</span></a><span class="k">def</span> <span class="nf">compute_batch_ranking</span><span class="p">(</span>
-</span><span id="compute_batch_ranking-486"><a href="#compute_batch_ranking-486"><span class="linenos">486</span></a>    <span class="n">line_tmp_storage</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span>
-</span><span id="compute_batch_ranking-487"><a href="#compute_batch_ranking-487"><span class="linenos">487</span></a>    <span class="n">numeric_column_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
-</span><span id="compute_batch_ranking-488"><a href="#compute_batch_ranking-488"><span class="linenos">488</span></a>    <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="compute_batch_ranking-489"><a href="#compute_batch_ranking-489"><span class="linenos">489</span></a>    <span class="n">cpu_pool</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="compute_batch_ranking-490"><a href="#compute_batch_ranking-490"><span class="linenos">490</span></a>    <span class="n">column_descriptions</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
-</span><span id="compute_batch_ranking-491"><a href="#compute_batch_ranking-491"><span class="linenos">491</span></a>    <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="compute_batch_ranking-492"><a href="#compute_batch_ranking-492"><span class="linenos">492</span></a>    <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="compute_batch_ranking-493"><a href="#compute_batch_ranking-493"><span class="linenos">493</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">BatchRankingSummary</span><span class="p">,</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]]:</span>
-</span><span id="compute_batch_ranking-494"><a href="#compute_batch_ranking-494"><span class="linenos">494</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Enrich the feature space and compute the batch importances&quot;&quot;&quot;</span>
-</span><span id="compute_batch_ranking-495"><a href="#compute_batch_ranking-495"><span class="linenos">495</span></a>
-</span><span id="compute_batch_ranking-496"><a href="#compute_batch_ranking-496"><span class="linenos">496</span></a>    <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">line_tmp_storage</span><span class="p">)</span>
-</span><span id="compute_batch_ranking-497"><a href="#compute_batch_ranking-497"><span class="linenos">497</span></a>    <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="n">column_descriptions</span>
-</span><span id="compute_batch_ranking-498"><a href="#compute_batch_ranking-498"><span class="linenos">498</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Control features&#39;</span><span class="p">)</span>
-</span><span id="compute_batch_ranking-499"><a href="#compute_batch_ranking-499"><span class="linenos">499</span></a>
-</span><span id="compute_batch_ranking-500"><a href="#compute_batch_ranking-500"><span class="linenos">500</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">feature_set_focus</span><span class="p">:</span>
-</span><span id="compute_batch_ranking-501"><a href="#compute_batch_ranking-501"><span class="linenos">501</span></a>        <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">feature_set_focus</span> <span class="o">==</span> <span class="s1">&#39;_all_from_reference_JSON&#39;</span><span class="p">:</span>
-</span><span id="compute_batch_ranking-502"><a href="#compute_batch_ranking-502"><span class="linenos">502</span></a>            <span class="n">focus_set</span> <span class="o">=</span> <span class="n">extract_features_from_reference_JSON</span><span class="p">(</span>
-</span><span id="compute_batch_ranking-503"><a href="#compute_batch_ranking-503"><span class="linenos">503</span></a>                <span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span><span class="p">,</span>
-</span><span id="compute_batch_ranking-504"><a href="#compute_batch_ranking-504"><span class="linenos">504</span></a>            <span class="p">)</span>
-</span><span id="compute_batch_ranking-505"><a href="#compute_batch_ranking-505"><span class="linenos">505</span></a>
-</span><span id="compute_batch_ranking-506"><a href="#compute_batch_ranking-506"><span class="linenos">506</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="compute_batch_ranking-507"><a href="#compute_batch_ranking-507"><span class="linenos">507</span></a>            <span class="n">focus_set</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">feature_set_focus</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))</span>
-</span><span id="compute_batch_ranking-508"><a href="#compute_batch_ranking-508"><span class="linenos">508</span></a>
-</span><span id="compute_batch_ranking-509"><a href="#compute_batch_ranking-509"><span class="linenos">509</span></a>        <span class="n">focus_set</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">label_column</span><span class="p">)</span>
-</span><span id="compute_batch_ranking-510"><a href="#compute_batch_ranking-510"><span class="linenos">510</span></a>        <span class="n">focus_set</span> <span class="o">=</span> <span class="p">{</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">focus_set</span> <span class="k">if</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span><span class="p">}</span>
-</span><span id="compute_batch_ranking-511"><a href="#compute_batch_ranking-511"><span class="linenos">511</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="nb">list</span><span class="p">(</span><span class="n">focus_set</span><span class="p">)]</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_batch_ranking-502"><a href="#compute_batch_ranking-502"><span class="linenos">502</span></a><span class="k">def</span> <span class="nf">compute_batch_ranking</span><span class="p">(</span>
+</span><span id="compute_batch_ranking-503"><a href="#compute_batch_ranking-503"><span class="linenos">503</span></a>    <span class="n">line_tmp_storage</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span>
+</span><span id="compute_batch_ranking-504"><a href="#compute_batch_ranking-504"><span class="linenos">504</span></a>    <span class="n">numeric_column_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
+</span><span id="compute_batch_ranking-505"><a href="#compute_batch_ranking-505"><span class="linenos">505</span></a>    <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="compute_batch_ranking-506"><a href="#compute_batch_ranking-506"><span class="linenos">506</span></a>    <span class="n">cpu_pool</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="compute_batch_ranking-507"><a href="#compute_batch_ranking-507"><span class="linenos">507</span></a>    <span class="n">column_descriptions</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
+</span><span id="compute_batch_ranking-508"><a href="#compute_batch_ranking-508"><span class="linenos">508</span></a>    <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="compute_batch_ranking-509"><a href="#compute_batch_ranking-509"><span class="linenos">509</span></a>    <span class="n">pbar</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="compute_batch_ranking-510"><a href="#compute_batch_ranking-510"><span class="linenos">510</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">BatchRankingSummary</span><span class="p">,</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]]:</span>
+</span><span id="compute_batch_ranking-511"><a href="#compute_batch_ranking-511"><span class="linenos">511</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Enrich the feature space and compute the batch importances&quot;&quot;&quot;</span>
 </span><span id="compute_batch_ranking-512"><a href="#compute_batch_ranking-512"><span class="linenos">512</span></a>
-</span><span id="compute_batch_ranking-513"><a href="#compute_batch_ranking-513"><span class="linenos">513</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">transformers</span> <span class="o">!=</span> <span class="s1">&#39;none&#39;</span><span class="p">:</span>
-</span><span id="compute_batch_ranking-514"><a href="#compute_batch_ranking-514"><span class="linenos">514</span></a>
-</span><span id="compute_batch_ranking-515"><a href="#compute_batch_ranking-515"><span class="linenos">515</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Adding transformations&#39;</span><span class="p">)</span>
-</span><span id="compute_batch_ranking-516"><a href="#compute_batch_ranking-516"><span class="linenos">516</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">enrich_with_transformations</span><span class="p">(</span>
-</span><span id="compute_batch_ranking-517"><a href="#compute_batch_ranking-517"><span class="linenos">517</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">numeric_column_types</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span>
-</span><span id="compute_batch_ranking-518"><a href="#compute_batch_ranking-518"><span class="linenos">518</span></a>        <span class="p">)</span>
-</span><span id="compute_batch_ranking-519"><a href="#compute_batch_ranking-519"><span class="linenos">519</span></a>
-</span><span id="compute_batch_ranking-520"><a href="#compute_batch_ranking-520"><span class="linenos">520</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">explode_multivalue_features</span> <span class="o">!=</span> <span class="s1">&#39;False&#39;</span><span class="p">:</span>
-</span><span id="compute_batch_ranking-521"><a href="#compute_batch_ranking-521"><span class="linenos">521</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Constructing new features from multivalue ones&#39;</span><span class="p">)</span>
-</span><span id="compute_batch_ranking-522"><a href="#compute_batch_ranking-522"><span class="linenos">522</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">compute_expanded_multivalue_features</span><span class="p">(</span>
-</span><span id="compute_batch_ranking-523"><a href="#compute_batch_ranking-523"><span class="linenos">523</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span>
-</span><span id="compute_batch_ranking-524"><a href="#compute_batch_ranking-524"><span class="linenos">524</span></a>        <span class="p">)</span>
+</span><span id="compute_batch_ranking-513"><a href="#compute_batch_ranking-513"><span class="linenos">513</span></a>    <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">line_tmp_storage</span><span class="p">)</span>
+</span><span id="compute_batch_ranking-514"><a href="#compute_batch_ranking-514"><span class="linenos">514</span></a>    <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="n">column_descriptions</span>
+</span><span id="compute_batch_ranking-515"><a href="#compute_batch_ranking-515"><span class="linenos">515</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Control features&#39;</span><span class="p">)</span>
+</span><span id="compute_batch_ranking-516"><a href="#compute_batch_ranking-516"><span class="linenos">516</span></a>
+</span><span id="compute_batch_ranking-517"><a href="#compute_batch_ranking-517"><span class="linenos">517</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">feature_set_focus</span><span class="p">:</span>
+</span><span id="compute_batch_ranking-518"><a href="#compute_batch_ranking-518"><span class="linenos">518</span></a>        <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">feature_set_focus</span> <span class="o">==</span> <span class="s1">&#39;_all_from_reference_JSON&#39;</span><span class="p">:</span>
+</span><span id="compute_batch_ranking-519"><a href="#compute_batch_ranking-519"><span class="linenos">519</span></a>            <span class="n">focus_set</span> <span class="o">=</span> <span class="n">extract_features_from_reference_JSON</span><span class="p">(</span>
+</span><span id="compute_batch_ranking-520"><a href="#compute_batch_ranking-520"><span class="linenos">520</span></a>                <span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span><span class="p">,</span>
+</span><span id="compute_batch_ranking-521"><a href="#compute_batch_ranking-521"><span class="linenos">521</span></a>            <span class="p">)</span>
+</span><span id="compute_batch_ranking-522"><a href="#compute_batch_ranking-522"><span class="linenos">522</span></a>
+</span><span id="compute_batch_ranking-523"><a href="#compute_batch_ranking-523"><span class="linenos">523</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="compute_batch_ranking-524"><a href="#compute_batch_ranking-524"><span class="linenos">524</span></a>            <span class="n">focus_set</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">feature_set_focus</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))</span>
 </span><span id="compute_batch_ranking-525"><a href="#compute_batch_ranking-525"><span class="linenos">525</span></a>
-</span><span id="compute_batch_ranking-526"><a href="#compute_batch_ranking-526"><span class="linenos">526</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">subfeature_mapping</span> <span class="o">!=</span> <span class="s1">&#39;False&#39;</span><span class="p">:</span>
-</span><span id="compute_batch_ranking-527"><a href="#compute_batch_ranking-527"><span class="linenos">527</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Constructing new (sub)features&#39;</span><span class="p">)</span>
-</span><span id="compute_batch_ranking-528"><a href="#compute_batch_ranking-528"><span class="linenos">528</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">compute_subfeatures</span><span class="p">(</span>
-</span><span id="compute_batch_ranking-529"><a href="#compute_batch_ranking-529"><span class="linenos">529</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span>
-</span><span id="compute_batch_ranking-530"><a href="#compute_batch_ranking-530"><span class="linenos">530</span></a>        <span class="p">)</span>
+</span><span id="compute_batch_ranking-526"><a href="#compute_batch_ranking-526"><span class="linenos">526</span></a>        <span class="n">focus_set</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">label_column</span><span class="p">)</span>
+</span><span id="compute_batch_ranking-527"><a href="#compute_batch_ranking-527"><span class="linenos">527</span></a>        <span class="n">focus_set</span> <span class="o">=</span> <span class="p">{</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">focus_set</span> <span class="k">if</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">input_dataframe</span><span class="o">.</span><span class="n">columns</span><span class="p">}</span>
+</span><span id="compute_batch_ranking-528"><a href="#compute_batch_ranking-528"><span class="linenos">528</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">input_dataframe</span><span class="p">[</span><span class="nb">list</span><span class="p">(</span><span class="n">focus_set</span><span class="p">)]</span>
+</span><span id="compute_batch_ranking-529"><a href="#compute_batch_ranking-529"><span class="linenos">529</span></a>
+</span><span id="compute_batch_ranking-530"><a href="#compute_batch_ranking-530"><span class="linenos">530</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">transformers</span> <span class="o">!=</span> <span class="s1">&#39;none&#39;</span><span class="p">:</span>
 </span><span id="compute_batch_ranking-531"><a href="#compute_batch_ranking-531"><span class="linenos">531</span></a>
-</span><span id="compute_batch_ranking-532"><a href="#compute_batch_ranking-532"><span class="linenos">532</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span> <span class="o">&gt;</span> <span class="mi">1</span> <span class="ow">or</span> <span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span><span class="p">:</span>
-</span><span id="compute_batch_ranking-533"><a href="#compute_batch_ranking-533"><span class="linenos">533</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Constructing new features&#39;</span><span class="p">)</span>
-</span><span id="compute_batch_ranking-534"><a href="#compute_batch_ranking-534"><span class="linenos">534</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">compute_combined_features</span><span class="p">(</span>
-</span><span id="compute_batch_ranking-535"><a href="#compute_batch_ranking-535"><span class="linenos">535</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span>
-</span><span id="compute_batch_ranking-536"><a href="#compute_batch_ranking-536"><span class="linenos">536</span></a>        <span class="p">)</span>
-</span><span id="compute_batch_ranking-537"><a href="#compute_batch_ranking-537"><span class="linenos">537</span></a>
-</span><span id="compute_batch_ranking-538"><a href="#compute_batch_ranking-538"><span class="linenos">538</span></a>    <span class="c1"># in case of 3mr we compute the score of combinations against the target</span>
-</span><span id="compute_batch_ranking-539"><a href="#compute_batch_ranking-539"><span class="linenos">539</span></a>    <span class="k">if</span> <span class="s1">&#39;3mr&#39;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">:</span>
-</span><span id="compute_batch_ranking-540"><a href="#compute_batch_ranking-540"><span class="linenos">540</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span>
-</span><span id="compute_batch_ranking-541"><a href="#compute_batch_ranking-541"><span class="linenos">541</span></a>            <span class="s1">&#39;Constructing features for computing relations in 3mr&#39;</span><span class="p">,</span>
-</span><span id="compute_batch_ranking-542"><a href="#compute_batch_ranking-542"><span class="linenos">542</span></a>        <span class="p">)</span>
-</span><span id="compute_batch_ranking-543"><a href="#compute_batch_ranking-543"><span class="linenos">543</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">compute_combined_features</span><span class="p">(</span>
-</span><span id="compute_batch_ranking-544"><a href="#compute_batch_ranking-544"><span class="linenos">544</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="compute_batch_ranking-545"><a href="#compute_batch_ranking-545"><span class="linenos">545</span></a>        <span class="p">)</span>
-</span><span id="compute_batch_ranking-546"><a href="#compute_batch_ranking-546"><span class="linenos">546</span></a>
-</span><span id="compute_batch_ranking-547"><a href="#compute_batch_ranking-547"><span class="linenos">547</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">include_noise_baseline_features</span> <span class="o">==</span> <span class="s1">&#39;True&#39;</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">!=</span> <span class="s1">&#39;Constant&#39;</span><span class="p">:</span>
-</span><span id="compute_batch_ranking-548"><a href="#compute_batch_ranking-548"><span class="linenos">548</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Computing baseline features&#39;</span><span class="p">)</span>
-</span><span id="compute_batch_ranking-549"><a href="#compute_batch_ranking-549"><span class="linenos">549</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">include_noisy_features</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="compute_batch_ranking-550"><a href="#compute_batch_ranking-550"><span class="linenos">550</span></a>
-</span><span id="compute_batch_ranking-551"><a href="#compute_batch_ranking-551"><span class="linenos">551</span></a>    <span class="c1"># Compute incremental statistic useful for data inspection/transformer generation</span>
-</span><span id="compute_batch_ranking-552"><a href="#compute_batch_ranking-552"><span class="linenos">552</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Computing coverage&#39;</span><span class="p">)</span>
-</span><span id="compute_batch_ranking-553"><a href="#compute_batch_ranking-553"><span class="linenos">553</span></a>    <span class="n">coverage_storage</span> <span class="o">=</span> <span class="n">compute_coverage</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="compute_batch_ranking-554"><a href="#compute_batch_ranking-554"><span class="linenos">554</span></a>    <span class="n">feature_memory_consumption</span> <span class="o">=</span> <span class="n">compute_feature_memory_consumption</span><span class="p">(</span>
-</span><span id="compute_batch_ranking-555"><a href="#compute_batch_ranking-555"><span class="linenos">555</span></a>        <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span>
-</span><span id="compute_batch_ranking-556"><a href="#compute_batch_ranking-556"><span class="linenos">556</span></a>    <span class="p">)</span>
-</span><span id="compute_batch_ranking-557"><a href="#compute_batch_ranking-557"><span class="linenos">557</span></a>    <span class="n">compute_cardinalities</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">max_unique_hist_constraint</span><span class="p">)</span>
-</span><span id="compute_batch_ranking-558"><a href="#compute_batch_ranking-558"><span class="linenos">558</span></a>
-</span><span id="compute_batch_ranking-559"><a href="#compute_batch_ranking-559"><span class="linenos">559</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">task</span> <span class="o">==</span> <span class="s1">&#39;identify_rare_values&#39;</span><span class="p">:</span>
-</span><span id="compute_batch_ranking-560"><a href="#compute_batch_ranking-560"><span class="linenos">560</span></a>        <span class="n">compute_value_counts</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-</span><span id="compute_batch_ranking-561"><a href="#compute_batch_ranking-561"><span class="linenos">561</span></a>
-</span><span id="compute_batch_ranking-562"><a href="#compute_batch_ranking-562"><span class="linenos">562</span></a>    <span class="n">bounds_storage</span> <span class="o">=</span> <span class="n">compute_bounds_increment</span><span class="p">(</span>
-</span><span id="compute_batch_ranking-563"><a href="#compute_batch_ranking-563"><span class="linenos">563</span></a>        <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">numeric_column_types</span><span class="p">,</span>
-</span><span id="compute_batch_ranking-564"><a href="#compute_batch_ranking-564"><span class="linenos">564</span></a>    <span class="p">)</span>
-</span><span id="compute_batch_ranking-565"><a href="#compute_batch_ranking-565"><span class="linenos">565</span></a>
-</span><span id="compute_batch_ranking-566"><a href="#compute_batch_ranking-566"><span class="linenos">566</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span>
-</span><span id="compute_batch_ranking-567"><a href="#compute_batch_ranking-567"><span class="linenos">567</span></a>        <span class="sa">f</span><span class="s1">&#39;Computing ranks for </span><span class="si">{</span><span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s1"> features&#39;</span><span class="p">,</span>
-</span><span id="compute_batch_ranking-568"><a href="#compute_batch_ranking-568"><span class="linenos">568</span></a>    <span class="p">)</span>
-</span><span id="compute_batch_ranking-569"><a href="#compute_batch_ranking-569"><span class="linenos">569</span></a>
-</span><span id="compute_batch_ranking-570"><a href="#compute_batch_ranking-570"><span class="linenos">570</span></a>    <span class="k">return</span> <span class="p">(</span>
-</span><span id="compute_batch_ranking-571"><a href="#compute_batch_ranking-571"><span class="linenos">571</span></a>        <span class="n">mixed_rank_graph</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">cpu_pool</span><span class="p">,</span> <span class="n">pbar</span><span class="p">),</span>
-</span><span id="compute_batch_ranking-572"><a href="#compute_batch_ranking-572"><span class="linenos">572</span></a>        <span class="n">bounds_storage</span><span class="p">,</span>
-</span><span id="compute_batch_ranking-573"><a href="#compute_batch_ranking-573"><span class="linenos">573</span></a>        <span class="n">coverage_storage</span><span class="p">,</span>
-</span><span id="compute_batch_ranking-574"><a href="#compute_batch_ranking-574"><span class="linenos">574</span></a>        <span class="n">feature_memory_consumption</span><span class="p">,</span>
-</span><span id="compute_batch_ranking-575"><a href="#compute_batch_ranking-575"><span class="linenos">575</span></a>    <span class="p">)</span>
+</span><span id="compute_batch_ranking-532"><a href="#compute_batch_ranking-532"><span class="linenos">532</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Adding transformations&#39;</span><span class="p">)</span>
+</span><span id="compute_batch_ranking-533"><a href="#compute_batch_ranking-533"><span class="linenos">533</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">enrich_with_transformations</span><span class="p">(</span>
+</span><span id="compute_batch_ranking-534"><a href="#compute_batch_ranking-534"><span class="linenos">534</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">numeric_column_types</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span>
+</span><span id="compute_batch_ranking-535"><a href="#compute_batch_ranking-535"><span class="linenos">535</span></a>        <span class="p">)</span>
+</span><span id="compute_batch_ranking-536"><a href="#compute_batch_ranking-536"><span class="linenos">536</span></a>
+</span><span id="compute_batch_ranking-537"><a href="#compute_batch_ranking-537"><span class="linenos">537</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">explode_multivalue_features</span> <span class="o">!=</span> <span class="s1">&#39;False&#39;</span><span class="p">:</span>
+</span><span id="compute_batch_ranking-538"><a href="#compute_batch_ranking-538"><span class="linenos">538</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Constructing new features from multivalue ones&#39;</span><span class="p">)</span>
+</span><span id="compute_batch_ranking-539"><a href="#compute_batch_ranking-539"><span class="linenos">539</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">compute_expanded_multivalue_features</span><span class="p">(</span>
+</span><span id="compute_batch_ranking-540"><a href="#compute_batch_ranking-540"><span class="linenos">540</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span>
+</span><span id="compute_batch_ranking-541"><a href="#compute_batch_ranking-541"><span class="linenos">541</span></a>        <span class="p">)</span>
+</span><span id="compute_batch_ranking-542"><a href="#compute_batch_ranking-542"><span class="linenos">542</span></a>
+</span><span id="compute_batch_ranking-543"><a href="#compute_batch_ranking-543"><span class="linenos">543</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">subfeature_mapping</span> <span class="o">!=</span> <span class="s1">&#39;False&#39;</span><span class="p">:</span>
+</span><span id="compute_batch_ranking-544"><a href="#compute_batch_ranking-544"><span class="linenos">544</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Constructing new (sub)features&#39;</span><span class="p">)</span>
+</span><span id="compute_batch_ranking-545"><a href="#compute_batch_ranking-545"><span class="linenos">545</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">compute_subfeatures</span><span class="p">(</span>
+</span><span id="compute_batch_ranking-546"><a href="#compute_batch_ranking-546"><span class="linenos">546</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span>
+</span><span id="compute_batch_ranking-547"><a href="#compute_batch_ranking-547"><span class="linenos">547</span></a>        <span class="p">)</span>
+</span><span id="compute_batch_ranking-548"><a href="#compute_batch_ranking-548"><span class="linenos">548</span></a>
+</span><span id="compute_batch_ranking-549"><a href="#compute_batch_ranking-549"><span class="linenos">549</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span> <span class="o">&gt;</span> <span class="mi">1</span> <span class="ow">or</span> <span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span><span class="p">:</span>
+</span><span id="compute_batch_ranking-550"><a href="#compute_batch_ranking-550"><span class="linenos">550</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Constructing new features&#39;</span><span class="p">)</span>
+</span><span id="compute_batch_ranking-551"><a href="#compute_batch_ranking-551"><span class="linenos">551</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">compute_combined_features</span><span class="p">(</span>
+</span><span id="compute_batch_ranking-552"><a href="#compute_batch_ranking-552"><span class="linenos">552</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span>
+</span><span id="compute_batch_ranking-553"><a href="#compute_batch_ranking-553"><span class="linenos">553</span></a>        <span class="p">)</span>
+</span><span id="compute_batch_ranking-554"><a href="#compute_batch_ranking-554"><span class="linenos">554</span></a>
+</span><span id="compute_batch_ranking-555"><a href="#compute_batch_ranking-555"><span class="linenos">555</span></a>    <span class="c1"># in case of 3mr we compute the score of combinations against the target</span>
+</span><span id="compute_batch_ranking-556"><a href="#compute_batch_ranking-556"><span class="linenos">556</span></a>    <span class="k">if</span> <span class="s1">&#39;3mr&#39;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">:</span>
+</span><span id="compute_batch_ranking-557"><a href="#compute_batch_ranking-557"><span class="linenos">557</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span>
+</span><span id="compute_batch_ranking-558"><a href="#compute_batch_ranking-558"><span class="linenos">558</span></a>            <span class="s1">&#39;Constructing features for computing relations in 3mr&#39;</span><span class="p">,</span>
+</span><span id="compute_batch_ranking-559"><a href="#compute_batch_ranking-559"><span class="linenos">559</span></a>        <span class="p">)</span>
+</span><span id="compute_batch_ranking-560"><a href="#compute_batch_ranking-560"><span class="linenos">560</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">compute_combined_features</span><span class="p">(</span>
+</span><span id="compute_batch_ranking-561"><a href="#compute_batch_ranking-561"><span class="linenos">561</span></a>            <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="compute_batch_ranking-562"><a href="#compute_batch_ranking-562"><span class="linenos">562</span></a>        <span class="p">)</span>
+</span><span id="compute_batch_ranking-563"><a href="#compute_batch_ranking-563"><span class="linenos">563</span></a>
+</span><span id="compute_batch_ranking-564"><a href="#compute_batch_ranking-564"><span class="linenos">564</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">include_noise_baseline_features</span> <span class="o">==</span> <span class="s1">&#39;True&#39;</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">!=</span> <span class="s1">&#39;Constant&#39;</span><span class="p">:</span>
+</span><span id="compute_batch_ranking-565"><a href="#compute_batch_ranking-565"><span class="linenos">565</span></a>        <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Computing baseline features&#39;</span><span class="p">)</span>
+</span><span id="compute_batch_ranking-566"><a href="#compute_batch_ranking-566"><span class="linenos">566</span></a>        <span class="n">input_dataframe</span> <span class="o">=</span> <span class="n">include_noisy_features</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">logger</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="compute_batch_ranking-567"><a href="#compute_batch_ranking-567"><span class="linenos">567</span></a>
+</span><span id="compute_batch_ranking-568"><a href="#compute_batch_ranking-568"><span class="linenos">568</span></a>    <span class="c1"># Compute incremental statistic useful for data inspection/transformer generation</span>
+</span><span id="compute_batch_ranking-569"><a href="#compute_batch_ranking-569"><span class="linenos">569</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Computing coverage&#39;</span><span class="p">)</span>
+</span><span id="compute_batch_ranking-570"><a href="#compute_batch_ranking-570"><span class="linenos">570</span></a>    <span class="n">coverage_storage</span> <span class="o">=</span> <span class="n">compute_coverage</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="compute_batch_ranking-571"><a href="#compute_batch_ranking-571"><span class="linenos">571</span></a>    <span class="n">feature_memory_consumption</span> <span class="o">=</span> <span class="n">compute_feature_memory_consumption</span><span class="p">(</span>
+</span><span id="compute_batch_ranking-572"><a href="#compute_batch_ranking-572"><span class="linenos">572</span></a>        <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span>
+</span><span id="compute_batch_ranking-573"><a href="#compute_batch_ranking-573"><span class="linenos">573</span></a>    <span class="p">)</span>
+</span><span id="compute_batch_ranking-574"><a href="#compute_batch_ranking-574"><span class="linenos">574</span></a>    <span class="n">compute_cardinalities</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">pbar</span><span class="p">,</span> <span class="n">args</span><span class="o">.</span><span class="n">max_unique_hist_constraint</span><span class="p">)</span>
+</span><span id="compute_batch_ranking-575"><a href="#compute_batch_ranking-575"><span class="linenos">575</span></a>
+</span><span id="compute_batch_ranking-576"><a href="#compute_batch_ranking-576"><span class="linenos">576</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">task</span> <span class="o">==</span> <span class="s1">&#39;identify_rare_values&#39;</span><span class="p">:</span>
+</span><span id="compute_batch_ranking-577"><a href="#compute_batch_ranking-577"><span class="linenos">577</span></a>        <span class="n">compute_value_counts</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
+</span><span id="compute_batch_ranking-578"><a href="#compute_batch_ranking-578"><span class="linenos">578</span></a>
+</span><span id="compute_batch_ranking-579"><a href="#compute_batch_ranking-579"><span class="linenos">579</span></a>    <span class="n">bounds_storage</span> <span class="o">=</span> <span class="n">compute_bounds_increment</span><span class="p">(</span>
+</span><span id="compute_batch_ranking-580"><a href="#compute_batch_ranking-580"><span class="linenos">580</span></a>        <span class="n">input_dataframe</span><span class="p">,</span> <span class="n">numeric_column_types</span><span class="p">,</span>
+</span><span id="compute_batch_ranking-581"><a href="#compute_batch_ranking-581"><span class="linenos">581</span></a>    <span class="p">)</span>
+</span><span id="compute_batch_ranking-582"><a href="#compute_batch_ranking-582"><span class="linenos">582</span></a>
+</span><span id="compute_batch_ranking-583"><a href="#compute_batch_ranking-583"><span class="linenos">583</span></a>    <span class="n">pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span>
+</span><span id="compute_batch_ranking-584"><a href="#compute_batch_ranking-584"><span class="linenos">584</span></a>        <span class="sa">f</span><span class="s1">&#39;Computing ranks for </span><span class="si">{</span><span class="n">input_dataframe</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s1"> features&#39;</span><span class="p">,</span>
+</span><span id="compute_batch_ranking-585"><a href="#compute_batch_ranking-585"><span class="linenos">585</span></a>    <span class="p">)</span>
+</span><span id="compute_batch_ranking-586"><a href="#compute_batch_ranking-586"><span class="linenos">586</span></a>
+</span><span id="compute_batch_ranking-587"><a href="#compute_batch_ranking-587"><span class="linenos">587</span></a>    <span class="k">return</span> <span class="p">(</span>
+</span><span id="compute_batch_ranking-588"><a href="#compute_batch_ranking-588"><span class="linenos">588</span></a>        <span class="n">mixed_rank_graph</span><span class="p">(</span><span class="n">input_dataframe</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">cpu_pool</span><span class="p">,</span> <span class="n">pbar</span><span class="p">),</span>
+</span><span id="compute_batch_ranking-589"><a href="#compute_batch_ranking-589"><span class="linenos">589</span></a>        <span class="n">bounds_storage</span><span class="p">,</span>
+</span><span id="compute_batch_ranking-590"><a href="#compute_batch_ranking-590"><span class="linenos">590</span></a>        <span class="n">coverage_storage</span><span class="p">,</span>
+</span><span id="compute_batch_ranking-591"><a href="#compute_batch_ranking-591"><span class="linenos">591</span></a>        <span class="n">feature_memory_consumption</span><span class="p">,</span>
+</span><span id="compute_batch_ranking-592"><a href="#compute_batch_ranking-592"><span class="linenos">592</span></a>    <span class="p">)</span>
 </span></pre></div>
 
 
@@ -1748,43 +1761,11 @@ <h1 class="modulename">
 </div>
 
 
-                </section>
-                <section id="get_num_of_instances">
-                            <input id="get_num_of_instances-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
-<div class="attr function">
-
-        <span class="def">def</span>
-        <span class="name">get_num_of_instances</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">fname</span><span class="p">:</span> <span class="nb">str</span></span><span class="return-annotation">) -> <span class="nb">int</span>:</span></span>
-
-                <label class="view-source-button" for="get_num_of_instances-view-source"><span>View Source</span></label>
-
-    </div>
-    <a class="headerlink" href="#get_num_of_instances"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="get_num_of_instances-578"><a href="#get_num_of_instances-578"><span class="linenos">578</span></a><span class="k">def</span> <span class="nf">get_num_of_instances</span><span class="p">(</span><span class="n">fname</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
-</span><span id="get_num_of_instances-579"><a href="#get_num_of_instances-579"><span class="linenos">579</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Count the number of lines in a file, fast - useful for progress logging&quot;&quot;&quot;</span>
-</span><span id="get_num_of_instances-580"><a href="#get_num_of_instances-580"><span class="linenos">580</span></a>
-</span><span id="get_num_of_instances-581"><a href="#get_num_of_instances-581"><span class="linenos">581</span></a>    <span class="k">def</span> <span class="nf">_make_gen</span><span class="p">(</span><span class="n">reader</span><span class="p">):</span>
-</span><span id="get_num_of_instances-582"><a href="#get_num_of_instances-582"><span class="linenos">582</span></a>        <span class="k">while</span> <span class="kc">True</span><span class="p">:</span>
-</span><span id="get_num_of_instances-583"><a href="#get_num_of_instances-583"><span class="linenos">583</span></a>            <span class="n">b</span> <span class="o">=</span> <span class="n">reader</span><span class="p">(</span><span class="mi">2</span><span class="o">**</span><span class="mi">16</span><span class="p">)</span>
-</span><span id="get_num_of_instances-584"><a href="#get_num_of_instances-584"><span class="linenos">584</span></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">b</span><span class="p">:</span>
-</span><span id="get_num_of_instances-585"><a href="#get_num_of_instances-585"><span class="linenos">585</span></a>                <span class="k">break</span>
-</span><span id="get_num_of_instances-586"><a href="#get_num_of_instances-586"><span class="linenos">586</span></a>            <span class="k">yield</span> <span class="n">b</span>
-</span><span id="get_num_of_instances-587"><a href="#get_num_of_instances-587"><span class="linenos">587</span></a>
-</span><span id="get_num_of_instances-588"><a href="#get_num_of_instances-588"><span class="linenos">588</span></a>    <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">fname</span><span class="p">,</span> <span class="s1">&#39;rb&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
-</span><span id="get_num_of_instances-589"><a href="#get_num_of_instances-589"><span class="linenos">589</span></a>        <span class="n">count</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">(</span><span class="n">buf</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="sa">b</span><span class="s1">&#39;</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">)</span> <span class="k">for</span> <span class="n">buf</span> <span class="ow">in</span> <span class="n">_make_gen</span><span class="p">(</span><span class="n">f</span><span class="o">.</span><span class="n">raw</span><span class="o">.</span><span class="n">read</span><span class="p">))</span>
-</span><span id="get_num_of_instances-590"><a href="#get_num_of_instances-590"><span class="linenos">590</span></a>    <span class="k">return</span> <span class="n">count</span>
-</span></pre></div>
-
-
-            <div class="docstring"><p>Count the number of lines in a file, fast - useful for progress logging</p>
-</div>
-
-
                 </section>
                 <section id="get_grouped_df">
                             <input id="get_grouped_df-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">get_grouped_df</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">importances_df_list</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>:</span></span>
 
@@ -1792,17 +1773,17 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#get_grouped_df"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="get_grouped_df-593"><a href="#get_grouped_df-593"><span class="linenos">593</span></a><span class="k">def</span> <span class="nf">get_grouped_df</span><span class="p">(</span><span class="n">importances_df_list</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">]])</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="get_grouped_df-594"><a href="#get_grouped_df-594"><span class="linenos">594</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;A helper method that enables median-based aggregation after processing&quot;&quot;&quot;</span>
-</span><span id="get_grouped_df-595"><a href="#get_grouped_df-595"><span class="linenos">595</span></a>
-</span><span id="get_grouped_df-596"><a href="#get_grouped_df-596"><span class="linenos">596</span></a>    <span class="n">importances_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">importances_df_list</span><span class="p">)</span>
-</span><span id="get_grouped_df-597"><a href="#get_grouped_df-597"><span class="linenos">597</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">importances_df</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="get_grouped_df-598"><a href="#get_grouped_df-598"><span class="linenos">598</span></a>        <span class="k">return</span> <span class="kc">None</span>
-</span><span id="get_grouped_df-599"><a href="#get_grouped_df-599"><span class="linenos">599</span></a>    <span class="n">importances_df</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;FeatureA&#39;</span><span class="p">,</span> <span class="s1">&#39;FeatureB&#39;</span><span class="p">,</span> <span class="s1">&#39;Score&#39;</span><span class="p">]</span>
-</span><span id="get_grouped_df-600"><a href="#get_grouped_df-600"><span class="linenos">600</span></a>    <span class="n">grouped</span> <span class="o">=</span> <span class="n">importances_df</span><span class="o">.</span><span class="n">groupby</span><span class="p">(</span>
-</span><span id="get_grouped_df-601"><a href="#get_grouped_df-601"><span class="linenos">601</span></a>        <span class="p">[</span><span class="s1">&#39;FeatureA&#39;</span><span class="p">,</span> <span class="s1">&#39;FeatureB&#39;</span><span class="p">],</span>
-</span><span id="get_grouped_df-602"><a href="#get_grouped_df-602"><span class="linenos">602</span></a>    <span class="p">)</span><span class="o">.</span><span class="n">median</span><span class="p">()</span><span class="o">.</span><span class="n">reset_index</span><span class="p">()</span>
-</span><span id="get_grouped_df-603"><a href="#get_grouped_df-603"><span class="linenos">603</span></a>    <span class="k">return</span> <span class="n">grouped</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="get_grouped_df-595"><a href="#get_grouped_df-595"><span class="linenos">595</span></a><span class="k">def</span> <span class="nf">get_grouped_df</span><span class="p">(</span><span class="n">importances_df_list</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">]])</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="get_grouped_df-596"><a href="#get_grouped_df-596"><span class="linenos">596</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;A helper method that enables median-based aggregation after processing&quot;&quot;&quot;</span>
+</span><span id="get_grouped_df-597"><a href="#get_grouped_df-597"><span class="linenos">597</span></a>
+</span><span id="get_grouped_df-598"><a href="#get_grouped_df-598"><span class="linenos">598</span></a>    <span class="n">importances_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">importances_df_list</span><span class="p">)</span>
+</span><span id="get_grouped_df-599"><a href="#get_grouped_df-599"><span class="linenos">599</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">importances_df</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="get_grouped_df-600"><a href="#get_grouped_df-600"><span class="linenos">600</span></a>        <span class="k">return</span> <span class="kc">None</span>
+</span><span id="get_grouped_df-601"><a href="#get_grouped_df-601"><span class="linenos">601</span></a>    <span class="n">importances_df</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;FeatureA&#39;</span><span class="p">,</span> <span class="s1">&#39;FeatureB&#39;</span><span class="p">,</span> <span class="s1">&#39;Score&#39;</span><span class="p">]</span>
+</span><span id="get_grouped_df-602"><a href="#get_grouped_df-602"><span class="linenos">602</span></a>    <span class="n">grouped</span> <span class="o">=</span> <span class="n">importances_df</span><span class="o">.</span><span class="n">groupby</span><span class="p">(</span>
+</span><span id="get_grouped_df-603"><a href="#get_grouped_df-603"><span class="linenos">603</span></a>        <span class="p">[</span><span class="s1">&#39;FeatureA&#39;</span><span class="p">,</span> <span class="s1">&#39;FeatureB&#39;</span><span class="p">],</span>
+</span><span id="get_grouped_df-604"><a href="#get_grouped_df-604"><span class="linenos">604</span></a>    <span class="p">)</span><span class="o">.</span><span class="n">median</span><span class="p">()</span><span class="o">.</span><span class="n">reset_index</span><span class="p">()</span>
+</span><span id="get_grouped_df-605"><a href="#get_grouped_df-605"><span class="linenos">605</span></a>    <span class="k">return</span> <span class="n">grouped</span>
 </span></pre></div>
 
 
@@ -1814,7 +1795,7 @@ <h1 class="modulename">
                 <section id="checkpoint_importances_df">
                             <input id="checkpoint_importances_df-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">checkpoint_importances_df</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">importances_batch</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="kc">None</span>:</span></span>
 
@@ -1822,12 +1803,12 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#checkpoint_importances_df"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="checkpoint_importances_df-606"><a href="#checkpoint_importances_df-606"><span class="linenos">606</span></a><span class="k">def</span> <span class="nf">checkpoint_importances_df</span><span class="p">(</span><span class="n">importances_batch</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">]])</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="checkpoint_importances_df-607"><a href="#checkpoint_importances_df-607"><span class="linenos">607</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;A helper which stores intermediary state - useful for longer runs&quot;&quot;&quot;</span>
-</span><span id="checkpoint_importances_df-608"><a href="#checkpoint_importances_df-608"><span class="linenos">608</span></a>
-</span><span id="checkpoint_importances_df-609"><a href="#checkpoint_importances_df-609"><span class="linenos">609</span></a>    <span class="n">gdf</span> <span class="o">=</span> <span class="n">get_grouped_df</span><span class="p">(</span><span class="n">importances_batch</span><span class="p">)</span>
-</span><span id="checkpoint_importances_df-610"><a href="#checkpoint_importances_df-610"><span class="linenos">610</span></a>    <span class="k">if</span> <span class="n">gdf</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="checkpoint_importances_df-611"><a href="#checkpoint_importances_df-611"><span class="linenos">611</span></a>        <span class="n">gdf</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span><span class="s1">&#39;ranking_checkpoint_tmp.tsv&#39;</span><span class="p">,</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="checkpoint_importances_df-608"><a href="#checkpoint_importances_df-608"><span class="linenos">608</span></a><span class="k">def</span> <span class="nf">checkpoint_importances_df</span><span class="p">(</span><span class="n">importances_batch</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">]])</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="checkpoint_importances_df-609"><a href="#checkpoint_importances_df-609"><span class="linenos">609</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;A helper which stores intermediary state - useful for longer runs&quot;&quot;&quot;</span>
+</span><span id="checkpoint_importances_df-610"><a href="#checkpoint_importances_df-610"><span class="linenos">610</span></a>
+</span><span id="checkpoint_importances_df-611"><a href="#checkpoint_importances_df-611"><span class="linenos">611</span></a>    <span class="n">gdf</span> <span class="o">=</span> <span class="n">get_grouped_df</span><span class="p">(</span><span class="n">importances_batch</span><span class="p">)</span>
+</span><span id="checkpoint_importances_df-612"><a href="#checkpoint_importances_df-612"><span class="linenos">612</span></a>    <span class="k">if</span> <span class="n">gdf</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="checkpoint_importances_df-613"><a href="#checkpoint_importances_df-613"><span class="linenos">613</span></a>        <span class="n">gdf</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span><span class="s1">&#39;ranking_checkpoint_tmp.tsv&#39;</span><span class="p">,</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -1839,7 +1820,7 @@ <h1 class="modulename">
                 <section id="estimate_importances_minibatches">
                             <input id="estimate_importances_minibatches-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">estimate_importances_minibatches</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">input_file</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">column_descriptions</span><span class="p">:</span> <span class="nb">list</span>,</span><span class="param">	<span class="n">fw_col_mapping</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">]</span>,</span><span class="param">	<span class="n">numeric_column_types</span><span class="p">:</span> <span class="nb">set</span>,</span><span class="param">	<span class="n">batch_size</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">100000</span>,</span><span class="param">	<span class="n">args</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">data_encoding</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;utf-8&#39;</span>,</span><span class="param">	<span class="n">cpu_pool</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">delimiter</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span>,</span><span class="param">	<span class="n">feature_construction_mode</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span>,</span><span class="param">	<span class="n">logger</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span></span><span class="return-annotation">) -> <span class="nb">tuple</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">]],</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">,</span> <span class="nb">dict</span><span class="p">[</span><span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">,</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">],</span> <span class="nb">list</span><span class="p">[</span><span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">]],</span> <span class="nb">list</span><span class="p">[</span><span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]],</span> <span class="n">collections</span><span class="o">.</span><span class="n">defaultdict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">]]</span>:</span></span>
 
@@ -1847,149 +1828,149 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#estimate_importances_minibatches"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="estimate_importances_minibatches-614"><a href="#estimate_importances_minibatches-614"><span class="linenos">614</span></a><span class="k">def</span> <span class="nf">estimate_importances_minibatches</span><span class="p">(</span>
-</span><span id="estimate_importances_minibatches-615"><a href="#estimate_importances_minibatches-615"><span class="linenos">615</span></a>    <span class="n">input_file</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-616"><a href="#estimate_importances_minibatches-616"><span class="linenos">616</span></a>    <span class="n">column_descriptions</span><span class="p">:</span> <span class="nb">list</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-617"><a href="#estimate_importances_minibatches-617"><span class="linenos">617</span></a>    <span class="n">fw_col_mapping</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span>
-</span><span id="estimate_importances_minibatches-618"><a href="#estimate_importances_minibatches-618"><span class="linenos">618</span></a>    <span class="n">numeric_column_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-619"><a href="#estimate_importances_minibatches-619"><span class="linenos">619</span></a>    <span class="n">batch_size</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">100000</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-620"><a href="#estimate_importances_minibatches-620"><span class="linenos">620</span></a>    <span class="n">args</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-621"><a href="#estimate_importances_minibatches-621"><span class="linenos">621</span></a>    <span class="n">data_encoding</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;utf-8&#39;</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-622"><a href="#estimate_importances_minibatches-622"><span class="linenos">622</span></a>    <span class="n">cpu_pool</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-623"><a href="#estimate_importances_minibatches-623"><span class="linenos">623</span></a>    <span class="n">delimiter</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-624"><a href="#estimate_importances_minibatches-624"><span class="linenos">624</span></a>    <span class="n">feature_construction_mode</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-625"><a href="#estimate_importances_minibatches-625"><span class="linenos">625</span></a>    <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-626"><a href="#estimate_importances_minibatches-626"><span class="linenos">626</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]],</span> <span class="n">Any</span><span class="p">,</span> <span class="nb">dict</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="nb">list</span><span class="p">[</span><span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]],</span> <span class="nb">list</span><span class="p">[</span><span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]],</span> <span class="n">defaultdict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]]:</span>
-</span><span id="estimate_importances_minibatches-627"><a href="#estimate_importances_minibatches-627"><span class="linenos">627</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Interaction score estimator - suitable for example for csv-like input data types.</span>
-</span><span id="estimate_importances_minibatches-628"><a href="#estimate_importances_minibatches-628"><span class="linenos">628</span></a><span class="sd">    This type of data is normally a single large csv, meaning that minibatch processing needs to</span>
-</span><span id="estimate_importances_minibatches-629"><a href="#estimate_importances_minibatches-629"><span class="linenos">629</span></a><span class="sd">    happen during incremental handling of the file (that&quot;s not the case for pre-separated ob data)</span>
-</span><span id="estimate_importances_minibatches-630"><a href="#estimate_importances_minibatches-630"><span class="linenos">630</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="estimate_importances_minibatches-631"><a href="#estimate_importances_minibatches-631"><span class="linenos">631</span></a>
-</span><span id="estimate_importances_minibatches-632"><a href="#estimate_importances_minibatches-632"><span class="linenos">632</span></a>    <span class="n">invalid_line_queue</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="n">deque</span><span class="p">([],</span> <span class="n">maxlen</span><span class="o">=</span><span class="mi">2</span><span class="o">**</span><span class="mi">5</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="estimate_importances_minibatches-616"><a href="#estimate_importances_minibatches-616"><span class="linenos">616</span></a><span class="k">def</span> <span class="nf">estimate_importances_minibatches</span><span class="p">(</span>
+</span><span id="estimate_importances_minibatches-617"><a href="#estimate_importances_minibatches-617"><span class="linenos">617</span></a>    <span class="n">input_file</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-618"><a href="#estimate_importances_minibatches-618"><span class="linenos">618</span></a>    <span class="n">column_descriptions</span><span class="p">:</span> <span class="nb">list</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-619"><a href="#estimate_importances_minibatches-619"><span class="linenos">619</span></a>    <span class="n">fw_col_mapping</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span>
+</span><span id="estimate_importances_minibatches-620"><a href="#estimate_importances_minibatches-620"><span class="linenos">620</span></a>    <span class="n">numeric_column_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-621"><a href="#estimate_importances_minibatches-621"><span class="linenos">621</span></a>    <span class="n">batch_size</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">100000</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-622"><a href="#estimate_importances_minibatches-622"><span class="linenos">622</span></a>    <span class="n">args</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-623"><a href="#estimate_importances_minibatches-623"><span class="linenos">623</span></a>    <span class="n">data_encoding</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;utf-8&#39;</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-624"><a href="#estimate_importances_minibatches-624"><span class="linenos">624</span></a>    <span class="n">cpu_pool</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-625"><a href="#estimate_importances_minibatches-625"><span class="linenos">625</span></a>    <span class="n">delimiter</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-626"><a href="#estimate_importances_minibatches-626"><span class="linenos">626</span></a>    <span class="n">feature_construction_mode</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-627"><a href="#estimate_importances_minibatches-627"><span class="linenos">627</span></a>    <span class="n">logger</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-628"><a href="#estimate_importances_minibatches-628"><span class="linenos">628</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]],</span> <span class="n">Any</span><span class="p">,</span> <span class="nb">dict</span><span class="p">[</span><span class="n">Any</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="nb">list</span><span class="p">[</span><span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]],</span> <span class="nb">list</span><span class="p">[</span><span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]],</span> <span class="n">defaultdict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]]:</span>
+</span><span id="estimate_importances_minibatches-629"><a href="#estimate_importances_minibatches-629"><span class="linenos">629</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Interaction score estimator - suitable for example for csv-like input data types.</span>
+</span><span id="estimate_importances_minibatches-630"><a href="#estimate_importances_minibatches-630"><span class="linenos">630</span></a><span class="sd">    This type of data is normally a single large csv, meaning that minibatch processing needs to</span>
+</span><span id="estimate_importances_minibatches-631"><a href="#estimate_importances_minibatches-631"><span class="linenos">631</span></a><span class="sd">    happen during incremental handling of the file (that&quot;s not the case for pre-separated ob data)</span>
+</span><span id="estimate_importances_minibatches-632"><a href="#estimate_importances_minibatches-632"><span class="linenos">632</span></a><span class="sd">    &quot;&quot;&quot;</span>
 </span><span id="estimate_importances_minibatches-633"><a href="#estimate_importances_minibatches-633"><span class="linenos">633</span></a>
-</span><span id="estimate_importances_minibatches-634"><a href="#estimate_importances_minibatches-634"><span class="linenos">634</span></a>    <span class="n">invalid_lines</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="estimate_importances_minibatches-635"><a href="#estimate_importances_minibatches-635"><span class="linenos">635</span></a>    <span class="n">line_counter</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="estimate_importances_minibatches-636"><a href="#estimate_importances_minibatches-636"><span class="linenos">636</span></a>
-</span><span id="estimate_importances_minibatches-637"><a href="#estimate_importances_minibatches-637"><span class="linenos">637</span></a>    <span class="n">importances_df</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="estimate_importances_minibatches-638"><a href="#estimate_importances_minibatches-638"><span class="linenos">638</span></a>    <span class="n">line_tmp_storage</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="estimate_importances_minibatches-639"><a href="#estimate_importances_minibatches-639"><span class="linenos">639</span></a>    <span class="n">bounds_storage_batch</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="estimate_importances_minibatches-640"><a href="#estimate_importances_minibatches-640"><span class="linenos">640</span></a>    <span class="n">memory_storage_batch</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="estimate_importances_minibatches-641"><a href="#estimate_importances_minibatches-641"><span class="linenos">641</span></a>    <span class="n">step_timing_checkpoints</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="estimate_importances_minibatches-642"><a href="#estimate_importances_minibatches-642"><span class="linenos">642</span></a>
-</span><span id="estimate_importances_minibatches-643"><a href="#estimate_importances_minibatches-643"><span class="linenos">643</span></a>    <span class="n">local_coverage_object</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-644"><a href="#estimate_importances_minibatches-644"><span class="linenos">644</span></a>    <span class="n">local_pbar</span> <span class="o">=</span> <span class="n">tqdm</span><span class="o">.</span><span class="n">tqdm</span><span class="p">(</span>
-</span><span id="estimate_importances_minibatches-645"><a href="#estimate_importances_minibatches-645"><span class="linenos">645</span></a>        <span class="n">total</span><span class="o">=</span><span class="n">get_num_of_instances</span><span class="p">(</span><span class="n">input_file</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">,</span> <span class="n">position</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">disable</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">disable_tqdm</span> <span class="o">==</span> <span class="s1">&#39;True&#39;</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-646"><a href="#estimate_importances_minibatches-646"><span class="linenos">646</span></a>    <span class="p">)</span>
-</span><span id="estimate_importances_minibatches-647"><a href="#estimate_importances_minibatches-647"><span class="linenos">647</span></a>
-</span><span id="estimate_importances_minibatches-648"><a href="#estimate_importances_minibatches-648"><span class="linenos">648</span></a>    <span class="n">file_name</span><span class="p">,</span> <span class="n">file_extension</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">splitext</span><span class="p">(</span><span class="n">input_file</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-634"><a href="#estimate_importances_minibatches-634"><span class="linenos">634</span></a>    <span class="n">invalid_line_queue</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="n">deque</span><span class="p">([],</span> <span class="n">maxlen</span><span class="o">=</span><span class="mi">2</span><span class="o">**</span><span class="mi">5</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-635"><a href="#estimate_importances_minibatches-635"><span class="linenos">635</span></a>
+</span><span id="estimate_importances_minibatches-636"><a href="#estimate_importances_minibatches-636"><span class="linenos">636</span></a>    <span class="n">invalid_lines</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="estimate_importances_minibatches-637"><a href="#estimate_importances_minibatches-637"><span class="linenos">637</span></a>    <span class="n">line_counter</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="estimate_importances_minibatches-638"><a href="#estimate_importances_minibatches-638"><span class="linenos">638</span></a>
+</span><span id="estimate_importances_minibatches-639"><a href="#estimate_importances_minibatches-639"><span class="linenos">639</span></a>    <span class="n">importances_df</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="estimate_importances_minibatches-640"><a href="#estimate_importances_minibatches-640"><span class="linenos">640</span></a>    <span class="n">line_tmp_storage</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="estimate_importances_minibatches-641"><a href="#estimate_importances_minibatches-641"><span class="linenos">641</span></a>    <span class="n">bounds_storage_batch</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="estimate_importances_minibatches-642"><a href="#estimate_importances_minibatches-642"><span class="linenos">642</span></a>    <span class="n">memory_storage_batch</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="estimate_importances_minibatches-643"><a href="#estimate_importances_minibatches-643"><span class="linenos">643</span></a>    <span class="n">step_timing_checkpoints</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="estimate_importances_minibatches-644"><a href="#estimate_importances_minibatches-644"><span class="linenos">644</span></a>
+</span><span id="estimate_importances_minibatches-645"><a href="#estimate_importances_minibatches-645"><span class="linenos">645</span></a>    <span class="n">local_coverage_object</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-646"><a href="#estimate_importances_minibatches-646"><span class="linenos">646</span></a>    <span class="n">local_pbar</span> <span class="o">=</span> <span class="n">tqdm</span><span class="o">.</span><span class="n">tqdm</span><span class="p">(</span>
+</span><span id="estimate_importances_minibatches-647"><a href="#estimate_importances_minibatches-647"><span class="linenos">647</span></a>        <span class="n">total</span><span class="o">=</span><span class="n">get_num_of_instances</span><span class="p">(</span><span class="n">input_file</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">,</span> <span class="n">position</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">disable</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">disable_tqdm</span> <span class="o">==</span> <span class="s1">&#39;True&#39;</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-648"><a href="#estimate_importances_minibatches-648"><span class="linenos">648</span></a>    <span class="p">)</span>
 </span><span id="estimate_importances_minibatches-649"><a href="#estimate_importances_minibatches-649"><span class="linenos">649</span></a>
-</span><span id="estimate_importances_minibatches-650"><a href="#estimate_importances_minibatches-650"><span class="linenos">650</span></a>    <span class="k">if</span> <span class="n">file_extension</span> <span class="o">==</span> <span class="s1">&#39;.gz&#39;</span><span class="p">:</span>
-</span><span id="estimate_importances_minibatches-651"><a href="#estimate_importances_minibatches-651"><span class="linenos">651</span></a>        <span class="n">file_stream</span> <span class="o">=</span> <span class="n">gzip</span><span class="o">.</span><span class="n">open</span><span class="p">(</span><span class="n">input_file</span><span class="p">,</span> <span class="s1">&#39;rt&#39;</span><span class="p">,</span> <span class="n">encoding</span><span class="o">=</span><span class="n">data_encoding</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-652"><a href="#estimate_importances_minibatches-652"><span class="linenos">652</span></a>
-</span><span id="estimate_importances_minibatches-653"><a href="#estimate_importances_minibatches-653"><span class="linenos">653</span></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="estimate_importances_minibatches-654"><a href="#estimate_importances_minibatches-654"><span class="linenos">654</span></a>        <span class="n">file_stream</span> <span class="o">=</span> <span class="nb">open</span><span class="p">(</span><span class="n">input_file</span><span class="p">,</span> <span class="n">encoding</span><span class="o">=</span><span class="n">data_encoding</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-655"><a href="#estimate_importances_minibatches-655"><span class="linenos">655</span></a>
-</span><span id="estimate_importances_minibatches-656"><a href="#estimate_importances_minibatches-656"><span class="linenos">656</span></a>    <span class="n">file_stream</span><span class="o">.</span><span class="n">readline</span><span class="p">()</span>
+</span><span id="estimate_importances_minibatches-650"><a href="#estimate_importances_minibatches-650"><span class="linenos">650</span></a>    <span class="n">file_name</span><span class="p">,</span> <span class="n">file_extension</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">splitext</span><span class="p">(</span><span class="n">input_file</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-651"><a href="#estimate_importances_minibatches-651"><span class="linenos">651</span></a>
+</span><span id="estimate_importances_minibatches-652"><a href="#estimate_importances_minibatches-652"><span class="linenos">652</span></a>    <span class="k">if</span> <span class="n">file_extension</span> <span class="o">==</span> <span class="s1">&#39;.gz&#39;</span><span class="p">:</span>
+</span><span id="estimate_importances_minibatches-653"><a href="#estimate_importances_minibatches-653"><span class="linenos">653</span></a>        <span class="n">file_stream</span> <span class="o">=</span> <span class="n">gzip</span><span class="o">.</span><span class="n">open</span><span class="p">(</span><span class="n">input_file</span><span class="p">,</span> <span class="s1">&#39;rt&#39;</span><span class="p">,</span> <span class="n">encoding</span><span class="o">=</span><span class="n">data_encoding</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-654"><a href="#estimate_importances_minibatches-654"><span class="linenos">654</span></a>
+</span><span id="estimate_importances_minibatches-655"><a href="#estimate_importances_minibatches-655"><span class="linenos">655</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="estimate_importances_minibatches-656"><a href="#estimate_importances_minibatches-656"><span class="linenos">656</span></a>        <span class="n">file_stream</span> <span class="o">=</span> <span class="nb">open</span><span class="p">(</span><span class="n">input_file</span><span class="p">,</span> <span class="n">encoding</span><span class="o">=</span><span class="n">data_encoding</span><span class="p">)</span>
 </span><span id="estimate_importances_minibatches-657"><a href="#estimate_importances_minibatches-657"><span class="linenos">657</span></a>
-</span><span id="estimate_importances_minibatches-658"><a href="#estimate_importances_minibatches-658"><span class="linenos">658</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Starting ranking computation&#39;</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-659"><a href="#estimate_importances_minibatches-659"><span class="linenos">659</span></a>    <span class="k">for</span> <span class="n">line</span> <span class="ow">in</span> <span class="n">file_stream</span><span class="p">:</span>
-</span><span id="estimate_importances_minibatches-660"><a href="#estimate_importances_minibatches-660"><span class="linenos">660</span></a>        <span class="n">line_counter</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="estimate_importances_minibatches-661"><a href="#estimate_importances_minibatches-661"><span class="linenos">661</span></a>        <span class="n">local_pbar</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-662"><a href="#estimate_importances_minibatches-662"><span class="linenos">662</span></a>
-</span><span id="estimate_importances_minibatches-663"><a href="#estimate_importances_minibatches-663"><span class="linenos">663</span></a>        <span class="k">if</span> <span class="n">line_counter</span> <span class="o">%</span> <span class="n">args</span><span class="o">.</span><span class="n">subsampling</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="estimate_importances_minibatches-664"><a href="#estimate_importances_minibatches-664"><span class="linenos">664</span></a>            <span class="k">continue</span>
-</span><span id="estimate_importances_minibatches-665"><a href="#estimate_importances_minibatches-665"><span class="linenos">665</span></a>
-</span><span id="estimate_importances_minibatches-666"><a href="#estimate_importances_minibatches-666"><span class="linenos">666</span></a>        <span class="n">parsed_line</span> <span class="o">=</span> <span class="n">generic_line_parser</span><span class="p">(</span>
-</span><span id="estimate_importances_minibatches-667"><a href="#estimate_importances_minibatches-667"><span class="linenos">667</span></a>            <span class="n">line</span><span class="p">,</span> <span class="n">delimiter</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">fw_col_mapping</span><span class="p">,</span> <span class="n">column_descriptions</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-668"><a href="#estimate_importances_minibatches-668"><span class="linenos">668</span></a>        <span class="p">)</span>
-</span><span id="estimate_importances_minibatches-669"><a href="#estimate_importances_minibatches-669"><span class="linenos">669</span></a>
-</span><span id="estimate_importances_minibatches-670"><a href="#estimate_importances_minibatches-670"><span class="linenos">670</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">parsed_line</span><span class="p">)</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">column_descriptions</span><span class="p">):</span>
-</span><span id="estimate_importances_minibatches-671"><a href="#estimate_importances_minibatches-671"><span class="linenos">671</span></a>            <span class="n">line_tmp_storage</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">parsed_line</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-672"><a href="#estimate_importances_minibatches-672"><span class="linenos">672</span></a>
-</span><span id="estimate_importances_minibatches-673"><a href="#estimate_importances_minibatches-673"><span class="linenos">673</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="estimate_importances_minibatches-674"><a href="#estimate_importances_minibatches-674"><span class="linenos">674</span></a>            <span class="n">invalid_line_queue</span><span class="o">.</span><span class="n">appendleft</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">parsed_line</span><span class="p">))</span>
-</span><span id="estimate_importances_minibatches-675"><a href="#estimate_importances_minibatches-675"><span class="linenos">675</span></a>            <span class="n">invalid_lines</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="estimate_importances_minibatches-676"><a href="#estimate_importances_minibatches-676"><span class="linenos">676</span></a>
-</span><span id="estimate_importances_minibatches-677"><a href="#estimate_importances_minibatches-677"><span class="linenos">677</span></a>        <span class="c1"># Batches need to be processed on-the-fly</span>
-</span><span id="estimate_importances_minibatches-678"><a href="#estimate_importances_minibatches-678"><span class="linenos">678</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">line_tmp_storage</span><span class="p">)</span> <span class="o">&gt;=</span> <span class="n">args</span><span class="o">.</span><span class="n">minibatch_size</span><span class="p">:</span>
-</span><span id="estimate_importances_minibatches-679"><a href="#estimate_importances_minibatches-679"><span class="linenos">679</span></a>
-</span><span id="estimate_importances_minibatches-680"><a href="#estimate_importances_minibatches-680"><span class="linenos">680</span></a>            <span class="n">importances_batch</span><span class="p">,</span> <span class="n">bounds_storage</span><span class="p">,</span> <span class="n">coverage_storage</span><span class="p">,</span> <span class="n">memory_storage</span> <span class="o">=</span> <span class="n">compute_batch_ranking</span><span class="p">(</span>
-</span><span id="estimate_importances_minibatches-681"><a href="#estimate_importances_minibatches-681"><span class="linenos">681</span></a>                <span class="n">line_tmp_storage</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-682"><a href="#estimate_importances_minibatches-682"><span class="linenos">682</span></a>                <span class="n">numeric_column_types</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-683"><a href="#estimate_importances_minibatches-683"><span class="linenos">683</span></a>                <span class="n">args</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-684"><a href="#estimate_importances_minibatches-684"><span class="linenos">684</span></a>                <span class="n">cpu_pool</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-685"><a href="#estimate_importances_minibatches-685"><span class="linenos">685</span></a>                <span class="n">column_descriptions</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-686"><a href="#estimate_importances_minibatches-686"><span class="linenos">686</span></a>                <span class="n">logger</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-687"><a href="#estimate_importances_minibatches-687"><span class="linenos">687</span></a>                <span class="n">local_pbar</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-688"><a href="#estimate_importances_minibatches-688"><span class="linenos">688</span></a>            <span class="p">)</span>
-</span><span id="estimate_importances_minibatches-689"><a href="#estimate_importances_minibatches-689"><span class="linenos">689</span></a>
-</span><span id="estimate_importances_minibatches-690"><a href="#estimate_importances_minibatches-690"><span class="linenos">690</span></a>            <span class="n">bounds_storage_batch</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">bounds_storage</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-691"><a href="#estimate_importances_minibatches-691"><span class="linenos">691</span></a>            <span class="n">memory_storage_batch</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">memory_storage</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-692"><a href="#estimate_importances_minibatches-692"><span class="linenos">692</span></a>            <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">coverage_storage</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="estimate_importances_minibatches-693"><a href="#estimate_importances_minibatches-693"><span class="linenos">693</span></a>                <span class="n">local_coverage_object</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">v</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-694"><a href="#estimate_importances_minibatches-694"><span class="linenos">694</span></a>
-</span><span id="estimate_importances_minibatches-695"><a href="#estimate_importances_minibatches-695"><span class="linenos">695</span></a>            <span class="k">del</span> <span class="n">coverage_storage</span>
+</span><span id="estimate_importances_minibatches-658"><a href="#estimate_importances_minibatches-658"><span class="linenos">658</span></a>    <span class="n">file_stream</span><span class="o">.</span><span class="n">readline</span><span class="p">()</span>
+</span><span id="estimate_importances_minibatches-659"><a href="#estimate_importances_minibatches-659"><span class="linenos">659</span></a>
+</span><span id="estimate_importances_minibatches-660"><a href="#estimate_importances_minibatches-660"><span class="linenos">660</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Starting ranking computation&#39;</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-661"><a href="#estimate_importances_minibatches-661"><span class="linenos">661</span></a>    <span class="k">for</span> <span class="n">line</span> <span class="ow">in</span> <span class="n">file_stream</span><span class="p">:</span>
+</span><span id="estimate_importances_minibatches-662"><a href="#estimate_importances_minibatches-662"><span class="linenos">662</span></a>        <span class="n">line_counter</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="estimate_importances_minibatches-663"><a href="#estimate_importances_minibatches-663"><span class="linenos">663</span></a>        <span class="n">local_pbar</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-664"><a href="#estimate_importances_minibatches-664"><span class="linenos">664</span></a>
+</span><span id="estimate_importances_minibatches-665"><a href="#estimate_importances_minibatches-665"><span class="linenos">665</span></a>        <span class="k">if</span> <span class="n">line_counter</span> <span class="o">%</span> <span class="n">args</span><span class="o">.</span><span class="n">subsampling</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="estimate_importances_minibatches-666"><a href="#estimate_importances_minibatches-666"><span class="linenos">666</span></a>            <span class="k">continue</span>
+</span><span id="estimate_importances_minibatches-667"><a href="#estimate_importances_minibatches-667"><span class="linenos">667</span></a>
+</span><span id="estimate_importances_minibatches-668"><a href="#estimate_importances_minibatches-668"><span class="linenos">668</span></a>        <span class="n">parsed_line</span> <span class="o">=</span> <span class="n">generic_line_parser</span><span class="p">(</span>
+</span><span id="estimate_importances_minibatches-669"><a href="#estimate_importances_minibatches-669"><span class="linenos">669</span></a>            <span class="n">line</span><span class="p">,</span> <span class="n">delimiter</span><span class="p">,</span> <span class="n">args</span><span class="p">,</span> <span class="n">fw_col_mapping</span><span class="p">,</span> <span class="n">column_descriptions</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-670"><a href="#estimate_importances_minibatches-670"><span class="linenos">670</span></a>        <span class="p">)</span>
+</span><span id="estimate_importances_minibatches-671"><a href="#estimate_importances_minibatches-671"><span class="linenos">671</span></a>
+</span><span id="estimate_importances_minibatches-672"><a href="#estimate_importances_minibatches-672"><span class="linenos">672</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">parsed_line</span><span class="p">)</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">column_descriptions</span><span class="p">):</span>
+</span><span id="estimate_importances_minibatches-673"><a href="#estimate_importances_minibatches-673"><span class="linenos">673</span></a>            <span class="n">line_tmp_storage</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">parsed_line</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-674"><a href="#estimate_importances_minibatches-674"><span class="linenos">674</span></a>
+</span><span id="estimate_importances_minibatches-675"><a href="#estimate_importances_minibatches-675"><span class="linenos">675</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="estimate_importances_minibatches-676"><a href="#estimate_importances_minibatches-676"><span class="linenos">676</span></a>            <span class="n">invalid_line_queue</span><span class="o">.</span><span class="n">appendleft</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">parsed_line</span><span class="p">))</span>
+</span><span id="estimate_importances_minibatches-677"><a href="#estimate_importances_minibatches-677"><span class="linenos">677</span></a>            <span class="n">invalid_lines</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="estimate_importances_minibatches-678"><a href="#estimate_importances_minibatches-678"><span class="linenos">678</span></a>
+</span><span id="estimate_importances_minibatches-679"><a href="#estimate_importances_minibatches-679"><span class="linenos">679</span></a>        <span class="c1"># Batches need to be processed on-the-fly</span>
+</span><span id="estimate_importances_minibatches-680"><a href="#estimate_importances_minibatches-680"><span class="linenos">680</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">line_tmp_storage</span><span class="p">)</span> <span class="o">&gt;=</span> <span class="n">args</span><span class="o">.</span><span class="n">minibatch_size</span><span class="p">:</span>
+</span><span id="estimate_importances_minibatches-681"><a href="#estimate_importances_minibatches-681"><span class="linenos">681</span></a>
+</span><span id="estimate_importances_minibatches-682"><a href="#estimate_importances_minibatches-682"><span class="linenos">682</span></a>            <span class="n">importances_batch</span><span class="p">,</span> <span class="n">bounds_storage</span><span class="p">,</span> <span class="n">coverage_storage</span><span class="p">,</span> <span class="n">memory_storage</span> <span class="o">=</span> <span class="n">compute_batch_ranking</span><span class="p">(</span>
+</span><span id="estimate_importances_minibatches-683"><a href="#estimate_importances_minibatches-683"><span class="linenos">683</span></a>                <span class="n">line_tmp_storage</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-684"><a href="#estimate_importances_minibatches-684"><span class="linenos">684</span></a>                <span class="n">numeric_column_types</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-685"><a href="#estimate_importances_minibatches-685"><span class="linenos">685</span></a>                <span class="n">args</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-686"><a href="#estimate_importances_minibatches-686"><span class="linenos">686</span></a>                <span class="n">cpu_pool</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-687"><a href="#estimate_importances_minibatches-687"><span class="linenos">687</span></a>                <span class="n">column_descriptions</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-688"><a href="#estimate_importances_minibatches-688"><span class="linenos">688</span></a>                <span class="n">logger</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-689"><a href="#estimate_importances_minibatches-689"><span class="linenos">689</span></a>                <span class="n">local_pbar</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-690"><a href="#estimate_importances_minibatches-690"><span class="linenos">690</span></a>            <span class="p">)</span>
+</span><span id="estimate_importances_minibatches-691"><a href="#estimate_importances_minibatches-691"><span class="linenos">691</span></a>
+</span><span id="estimate_importances_minibatches-692"><a href="#estimate_importances_minibatches-692"><span class="linenos">692</span></a>            <span class="n">bounds_storage_batch</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">bounds_storage</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-693"><a href="#estimate_importances_minibatches-693"><span class="linenos">693</span></a>            <span class="n">memory_storage_batch</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">memory_storage</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-694"><a href="#estimate_importances_minibatches-694"><span class="linenos">694</span></a>            <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">coverage_storage</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="estimate_importances_minibatches-695"><a href="#estimate_importances_minibatches-695"><span class="linenos">695</span></a>                <span class="n">local_coverage_object</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">v</span><span class="p">)</span>
 </span><span id="estimate_importances_minibatches-696"><a href="#estimate_importances_minibatches-696"><span class="linenos">696</span></a>
-</span><span id="estimate_importances_minibatches-697"><a href="#estimate_importances_minibatches-697"><span class="linenos">697</span></a>            <span class="n">line_tmp_storage</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="estimate_importances_minibatches-698"><a href="#estimate_importances_minibatches-698"><span class="linenos">698</span></a>            <span class="n">step_timing_checkpoints</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">importances_batch</span><span class="o">.</span><span class="n">step_times</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-699"><a href="#estimate_importances_minibatches-699"><span class="linenos">699</span></a>            <span class="n">importances_df</span> <span class="o">+=</span> <span class="n">importances_batch</span><span class="o">.</span><span class="n">triplet_scores</span>
-</span><span id="estimate_importances_minibatches-700"><a href="#estimate_importances_minibatches-700"><span class="linenos">700</span></a>
-</span><span id="estimate_importances_minibatches-701"><a href="#estimate_importances_minibatches-701"><span class="linenos">701</span></a>            <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">!=</span> <span class="s1">&#39;Constant&#39;</span><span class="p">:</span>
-</span><span id="estimate_importances_minibatches-702"><a href="#estimate_importances_minibatches-702"><span class="linenos">702</span></a>                <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Creating checkpoint&#39;</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-703"><a href="#estimate_importances_minibatches-703"><span class="linenos">703</span></a>                <span class="n">checkpoint_importances_df</span><span class="p">(</span><span class="n">importances_df</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-704"><a href="#estimate_importances_minibatches-704"><span class="linenos">704</span></a>
-</span><span id="estimate_importances_minibatches-705"><a href="#estimate_importances_minibatches-705"><span class="linenos">705</span></a>    <span class="n">file_stream</span><span class="o">.</span><span class="n">close</span><span class="p">()</span>
+</span><span id="estimate_importances_minibatches-697"><a href="#estimate_importances_minibatches-697"><span class="linenos">697</span></a>            <span class="k">del</span> <span class="n">coverage_storage</span>
+</span><span id="estimate_importances_minibatches-698"><a href="#estimate_importances_minibatches-698"><span class="linenos">698</span></a>
+</span><span id="estimate_importances_minibatches-699"><a href="#estimate_importances_minibatches-699"><span class="linenos">699</span></a>            <span class="n">line_tmp_storage</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="estimate_importances_minibatches-700"><a href="#estimate_importances_minibatches-700"><span class="linenos">700</span></a>            <span class="n">step_timing_checkpoints</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">importances_batch</span><span class="o">.</span><span class="n">step_times</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-701"><a href="#estimate_importances_minibatches-701"><span class="linenos">701</span></a>            <span class="n">importances_df</span> <span class="o">+=</span> <span class="n">importances_batch</span><span class="o">.</span><span class="n">triplet_scores</span>
+</span><span id="estimate_importances_minibatches-702"><a href="#estimate_importances_minibatches-702"><span class="linenos">702</span></a>
+</span><span id="estimate_importances_minibatches-703"><a href="#estimate_importances_minibatches-703"><span class="linenos">703</span></a>            <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="o">!=</span> <span class="s1">&#39;Constant&#39;</span><span class="p">:</span>
+</span><span id="estimate_importances_minibatches-704"><a href="#estimate_importances_minibatches-704"><span class="linenos">704</span></a>                <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Creating checkpoint&#39;</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-705"><a href="#estimate_importances_minibatches-705"><span class="linenos">705</span></a>                <span class="n">checkpoint_importances_df</span><span class="p">(</span><span class="n">importances_df</span><span class="p">)</span>
 </span><span id="estimate_importances_minibatches-706"><a href="#estimate_importances_minibatches-706"><span class="linenos">706</span></a>
-</span><span id="estimate_importances_minibatches-707"><a href="#estimate_importances_minibatches-707"><span class="linenos">707</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Parsing the remainder&#39;</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-708"><a href="#estimate_importances_minibatches-708"><span class="linenos">708</span></a>    <span class="k">if</span> <span class="n">invalid_lines</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="estimate_importances_minibatches-709"><a href="#estimate_importances_minibatches-709"><span class="linenos">709</span></a>        <span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="estimate_importances_minibatches-710"><a href="#estimate_importances_minibatches-710"><span class="linenos">710</span></a>            <span class="sa">f</span><span class="s2">&quot;Detected </span><span class="si">{</span><span class="n">invalid_lines</span><span class="si">}</span><span class="s2"> invalid lines. If this number is very high, it&#39;s possible your header is off - re-check your data/attribute-feature mappings please!&quot;</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-711"><a href="#estimate_importances_minibatches-711"><span class="linenos">711</span></a>        <span class="p">)</span>
-</span><span id="estimate_importances_minibatches-712"><a href="#estimate_importances_minibatches-712"><span class="linenos">712</span></a>
-</span><span id="estimate_importances_minibatches-713"><a href="#estimate_importances_minibatches-713"><span class="linenos">713</span></a>        <span class="n">invalid_lines_log</span> <span class="o">=</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1"> INVALID_LINE ====&gt; &#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
-</span><span id="estimate_importances_minibatches-714"><a href="#estimate_importances_minibatches-714"><span class="linenos">714</span></a>            <span class="nb">list</span><span class="p">(</span><span class="n">invalid_line_queue</span><span class="p">)[</span><span class="mi">0</span><span class="p">:</span><span class="mi">5</span><span class="p">],</span>
-</span><span id="estimate_importances_minibatches-715"><a href="#estimate_importances_minibatches-715"><span class="linenos">715</span></a>        <span class="p">)</span>
-</span><span id="estimate_importances_minibatches-716"><a href="#estimate_importances_minibatches-716"><span class="linenos">716</span></a>        <span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="estimate_importances_minibatches-717"><a href="#estimate_importances_minibatches-717"><span class="linenos">717</span></a>            <span class="sa">f</span><span class="s1">&#39;5 samples of invalid lines are printed below</span><span class="se">\n</span><span class="s1"> </span><span class="si">{</span><span class="n">invalid_lines_log</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-718"><a href="#estimate_importances_minibatches-718"><span class="linenos">718</span></a>        <span class="p">)</span>
-</span><span id="estimate_importances_minibatches-719"><a href="#estimate_importances_minibatches-719"><span class="linenos">719</span></a>
-</span><span id="estimate_importances_minibatches-720"><a href="#estimate_importances_minibatches-720"><span class="linenos">720</span></a>    <span class="n">remaining_batch_size</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">line_tmp_storage</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-707"><a href="#estimate_importances_minibatches-707"><span class="linenos">707</span></a>    <span class="n">file_stream</span><span class="o">.</span><span class="n">close</span><span class="p">()</span>
+</span><span id="estimate_importances_minibatches-708"><a href="#estimate_importances_minibatches-708"><span class="linenos">708</span></a>
+</span><span id="estimate_importances_minibatches-709"><a href="#estimate_importances_minibatches-709"><span class="linenos">709</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Parsing the remainder&#39;</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-710"><a href="#estimate_importances_minibatches-710"><span class="linenos">710</span></a>    <span class="k">if</span> <span class="n">invalid_lines</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="estimate_importances_minibatches-711"><a href="#estimate_importances_minibatches-711"><span class="linenos">711</span></a>        <span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="estimate_importances_minibatches-712"><a href="#estimate_importances_minibatches-712"><span class="linenos">712</span></a>            <span class="sa">f</span><span class="s2">&quot;Detected </span><span class="si">{</span><span class="n">invalid_lines</span><span class="si">}</span><span class="s2"> invalid lines. If this number is very high, it&#39;s possible your header is off - re-check your data/attribute-feature mappings please!&quot;</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-713"><a href="#estimate_importances_minibatches-713"><span class="linenos">713</span></a>        <span class="p">)</span>
+</span><span id="estimate_importances_minibatches-714"><a href="#estimate_importances_minibatches-714"><span class="linenos">714</span></a>
+</span><span id="estimate_importances_minibatches-715"><a href="#estimate_importances_minibatches-715"><span class="linenos">715</span></a>        <span class="n">invalid_lines_log</span> <span class="o">=</span> <span class="s1">&#39;</span><span class="se">\n</span><span class="s1"> INVALID_LINE ====&gt; &#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span>
+</span><span id="estimate_importances_minibatches-716"><a href="#estimate_importances_minibatches-716"><span class="linenos">716</span></a>            <span class="nb">list</span><span class="p">(</span><span class="n">invalid_line_queue</span><span class="p">)[</span><span class="mi">0</span><span class="p">:</span><span class="mi">5</span><span class="p">],</span>
+</span><span id="estimate_importances_minibatches-717"><a href="#estimate_importances_minibatches-717"><span class="linenos">717</span></a>        <span class="p">)</span>
+</span><span id="estimate_importances_minibatches-718"><a href="#estimate_importances_minibatches-718"><span class="linenos">718</span></a>        <span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="estimate_importances_minibatches-719"><a href="#estimate_importances_minibatches-719"><span class="linenos">719</span></a>            <span class="sa">f</span><span class="s1">&#39;5 samples of invalid lines are printed below</span><span class="se">\n</span><span class="s1"> </span><span class="si">{</span><span class="n">invalid_lines_log</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-720"><a href="#estimate_importances_minibatches-720"><span class="linenos">720</span></a>        <span class="p">)</span>
 </span><span id="estimate_importances_minibatches-721"><a href="#estimate_importances_minibatches-721"><span class="linenos">721</span></a>
-</span><span id="estimate_importances_minibatches-722"><a href="#estimate_importances_minibatches-722"><span class="linenos">722</span></a>    <span class="k">if</span> <span class="n">remaining_batch_size</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="o">**</span><span class="mi">10</span><span class="p">:</span>
-</span><span id="estimate_importances_minibatches-723"><a href="#estimate_importances_minibatches-723"><span class="linenos">723</span></a>        <span class="n">line_tmp_storage</span> <span class="o">=</span> <span class="n">line_tmp_storage</span><span class="p">[:</span> <span class="n">args</span><span class="o">.</span><span class="n">minibatch_size</span><span class="p">]</span>
-</span><span id="estimate_importances_minibatches-724"><a href="#estimate_importances_minibatches-724"><span class="linenos">724</span></a>        <span class="n">importances_batch</span><span class="p">,</span> <span class="n">bounds_storage</span><span class="p">,</span> <span class="n">coverage_storage</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">compute_batch_ranking</span><span class="p">(</span>
-</span><span id="estimate_importances_minibatches-725"><a href="#estimate_importances_minibatches-725"><span class="linenos">725</span></a>            <span class="n">line_tmp_storage</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-726"><a href="#estimate_importances_minibatches-726"><span class="linenos">726</span></a>            <span class="n">numeric_column_types</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-727"><a href="#estimate_importances_minibatches-727"><span class="linenos">727</span></a>            <span class="n">args</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-728"><a href="#estimate_importances_minibatches-728"><span class="linenos">728</span></a>            <span class="n">cpu_pool</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-729"><a href="#estimate_importances_minibatches-729"><span class="linenos">729</span></a>            <span class="n">column_descriptions</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-730"><a href="#estimate_importances_minibatches-730"><span class="linenos">730</span></a>            <span class="n">logger</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-731"><a href="#estimate_importances_minibatches-731"><span class="linenos">731</span></a>            <span class="n">local_pbar</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-732"><a href="#estimate_importances_minibatches-732"><span class="linenos">732</span></a>        <span class="p">)</span>
-</span><span id="estimate_importances_minibatches-733"><a href="#estimate_importances_minibatches-733"><span class="linenos">733</span></a>
-</span><span id="estimate_importances_minibatches-734"><a href="#estimate_importances_minibatches-734"><span class="linenos">734</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">coverage_storage</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="estimate_importances_minibatches-735"><a href="#estimate_importances_minibatches-735"><span class="linenos">735</span></a>            <span class="n">local_coverage_object</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">v</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-736"><a href="#estimate_importances_minibatches-736"><span class="linenos">736</span></a>
-</span><span id="estimate_importances_minibatches-737"><a href="#estimate_importances_minibatches-737"><span class="linenos">737</span></a>        <span class="n">step_timing_checkpoints</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">importances_batch</span><span class="o">.</span><span class="n">step_times</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-738"><a href="#estimate_importances_minibatches-738"><span class="linenos">738</span></a>        <span class="n">importances_df</span> <span class="o">+=</span> <span class="n">importances_batch</span><span class="o">.</span><span class="n">triplet_scores</span>
-</span><span id="estimate_importances_minibatches-739"><a href="#estimate_importances_minibatches-739"><span class="linenos">739</span></a>        <span class="n">bounds_storage</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
-</span><span id="estimate_importances_minibatches-740"><a href="#estimate_importances_minibatches-740"><span class="linenos">740</span></a>        <span class="n">bounds_storage_batch</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">bounds_storage</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-741"><a href="#estimate_importances_minibatches-741"><span class="linenos">741</span></a>        <span class="n">checkpoint_importances_df</span><span class="p">(</span><span class="n">importances_df</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-742"><a href="#estimate_importances_minibatches-742"><span class="linenos">742</span></a>
-</span><span id="estimate_importances_minibatches-743"><a href="#estimate_importances_minibatches-743"><span class="linenos">743</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Wrapping up&#39;</span><span class="p">)</span>
-</span><span id="estimate_importances_minibatches-744"><a href="#estimate_importances_minibatches-744"><span class="linenos">744</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">close</span><span class="p">()</span>
-</span><span id="estimate_importances_minibatches-745"><a href="#estimate_importances_minibatches-745"><span class="linenos">745</span></a>
-</span><span id="estimate_importances_minibatches-746"><a href="#estimate_importances_minibatches-746"><span class="linenos">746</span></a>    <span class="k">return</span> <span class="p">(</span>
-</span><span id="estimate_importances_minibatches-747"><a href="#estimate_importances_minibatches-747"><span class="linenos">747</span></a>        <span class="n">step_timing_checkpoints</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-748"><a href="#estimate_importances_minibatches-748"><span class="linenos">748</span></a>        <span class="n">get_grouped_df</span><span class="p">(</span><span class="n">importances_df</span><span class="p">),</span>
-</span><span id="estimate_importances_minibatches-749"><a href="#estimate_importances_minibatches-749"><span class="linenos">749</span></a>        <span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="o">.</span><span class="n">copy</span><span class="p">(),</span>
-</span><span id="estimate_importances_minibatches-750"><a href="#estimate_importances_minibatches-750"><span class="linenos">750</span></a>        <span class="n">bounds_storage_batch</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-751"><a href="#estimate_importances_minibatches-751"><span class="linenos">751</span></a>        <span class="n">memory_storage_batch</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-752"><a href="#estimate_importances_minibatches-752"><span class="linenos">752</span></a>        <span class="n">local_coverage_object</span><span class="p">,</span>
-</span><span id="estimate_importances_minibatches-753"><a href="#estimate_importances_minibatches-753"><span class="linenos">753</span></a>        <span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="o">.</span><span class="n">copy</span><span class="p">(),</span>
-</span><span id="estimate_importances_minibatches-754"><a href="#estimate_importances_minibatches-754"><span class="linenos">754</span></a>        <span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="o">.</span><span class="n">copy</span><span class="p">(),</span>
-</span><span id="estimate_importances_minibatches-755"><a href="#estimate_importances_minibatches-755"><span class="linenos">755</span></a>        <span class="n">GLOBAL_COUNTS_STORAGE</span><span class="o">.</span><span class="n">copy</span><span class="p">(),</span>
-</span><span id="estimate_importances_minibatches-756"><a href="#estimate_importances_minibatches-756"><span class="linenos">756</span></a>    <span class="p">)</span>
+</span><span id="estimate_importances_minibatches-722"><a href="#estimate_importances_minibatches-722"><span class="linenos">722</span></a>    <span class="n">remaining_batch_size</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">line_tmp_storage</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-723"><a href="#estimate_importances_minibatches-723"><span class="linenos">723</span></a>
+</span><span id="estimate_importances_minibatches-724"><a href="#estimate_importances_minibatches-724"><span class="linenos">724</span></a>    <span class="k">if</span> <span class="n">remaining_batch_size</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="o">**</span><span class="mi">10</span><span class="p">:</span>
+</span><span id="estimate_importances_minibatches-725"><a href="#estimate_importances_minibatches-725"><span class="linenos">725</span></a>        <span class="n">line_tmp_storage</span> <span class="o">=</span> <span class="n">line_tmp_storage</span><span class="p">[:</span> <span class="n">args</span><span class="o">.</span><span class="n">minibatch_size</span><span class="p">]</span>
+</span><span id="estimate_importances_minibatches-726"><a href="#estimate_importances_minibatches-726"><span class="linenos">726</span></a>        <span class="n">importances_batch</span><span class="p">,</span> <span class="n">bounds_storage</span><span class="p">,</span> <span class="n">coverage_storage</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">compute_batch_ranking</span><span class="p">(</span>
+</span><span id="estimate_importances_minibatches-727"><a href="#estimate_importances_minibatches-727"><span class="linenos">727</span></a>            <span class="n">line_tmp_storage</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-728"><a href="#estimate_importances_minibatches-728"><span class="linenos">728</span></a>            <span class="n">numeric_column_types</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-729"><a href="#estimate_importances_minibatches-729"><span class="linenos">729</span></a>            <span class="n">args</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-730"><a href="#estimate_importances_minibatches-730"><span class="linenos">730</span></a>            <span class="n">cpu_pool</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-731"><a href="#estimate_importances_minibatches-731"><span class="linenos">731</span></a>            <span class="n">column_descriptions</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-732"><a href="#estimate_importances_minibatches-732"><span class="linenos">732</span></a>            <span class="n">logger</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-733"><a href="#estimate_importances_minibatches-733"><span class="linenos">733</span></a>            <span class="n">local_pbar</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-734"><a href="#estimate_importances_minibatches-734"><span class="linenos">734</span></a>        <span class="p">)</span>
+</span><span id="estimate_importances_minibatches-735"><a href="#estimate_importances_minibatches-735"><span class="linenos">735</span></a>
+</span><span id="estimate_importances_minibatches-736"><a href="#estimate_importances_minibatches-736"><span class="linenos">736</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">coverage_storage</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="estimate_importances_minibatches-737"><a href="#estimate_importances_minibatches-737"><span class="linenos">737</span></a>            <span class="n">local_coverage_object</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">v</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-738"><a href="#estimate_importances_minibatches-738"><span class="linenos">738</span></a>
+</span><span id="estimate_importances_minibatches-739"><a href="#estimate_importances_minibatches-739"><span class="linenos">739</span></a>        <span class="n">step_timing_checkpoints</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">importances_batch</span><span class="o">.</span><span class="n">step_times</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-740"><a href="#estimate_importances_minibatches-740"><span class="linenos">740</span></a>        <span class="n">importances_df</span> <span class="o">+=</span> <span class="n">importances_batch</span><span class="o">.</span><span class="n">triplet_scores</span>
+</span><span id="estimate_importances_minibatches-741"><a href="#estimate_importances_minibatches-741"><span class="linenos">741</span></a>        <span class="n">bounds_storage</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
+</span><span id="estimate_importances_minibatches-742"><a href="#estimate_importances_minibatches-742"><span class="linenos">742</span></a>        <span class="n">bounds_storage_batch</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">bounds_storage</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-743"><a href="#estimate_importances_minibatches-743"><span class="linenos">743</span></a>        <span class="n">checkpoint_importances_df</span><span class="p">(</span><span class="n">importances_df</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-744"><a href="#estimate_importances_minibatches-744"><span class="linenos">744</span></a>
+</span><span id="estimate_importances_minibatches-745"><a href="#estimate_importances_minibatches-745"><span class="linenos">745</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Wrapping up&#39;</span><span class="p">)</span>
+</span><span id="estimate_importances_minibatches-746"><a href="#estimate_importances_minibatches-746"><span class="linenos">746</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">close</span><span class="p">()</span>
+</span><span id="estimate_importances_minibatches-747"><a href="#estimate_importances_minibatches-747"><span class="linenos">747</span></a>
+</span><span id="estimate_importances_minibatches-748"><a href="#estimate_importances_minibatches-748"><span class="linenos">748</span></a>    <span class="k">return</span> <span class="p">(</span>
+</span><span id="estimate_importances_minibatches-749"><a href="#estimate_importances_minibatches-749"><span class="linenos">749</span></a>        <span class="n">step_timing_checkpoints</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-750"><a href="#estimate_importances_minibatches-750"><span class="linenos">750</span></a>        <span class="n">get_grouped_df</span><span class="p">(</span><span class="n">importances_df</span><span class="p">),</span>
+</span><span id="estimate_importances_minibatches-751"><a href="#estimate_importances_minibatches-751"><span class="linenos">751</span></a>        <span class="n">GLOBAL_CARDINALITY_STORAGE</span><span class="o">.</span><span class="n">copy</span><span class="p">(),</span>
+</span><span id="estimate_importances_minibatches-752"><a href="#estimate_importances_minibatches-752"><span class="linenos">752</span></a>        <span class="n">bounds_storage_batch</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-753"><a href="#estimate_importances_minibatches-753"><span class="linenos">753</span></a>        <span class="n">memory_storage_batch</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-754"><a href="#estimate_importances_minibatches-754"><span class="linenos">754</span></a>        <span class="n">local_coverage_object</span><span class="p">,</span>
+</span><span id="estimate_importances_minibatches-755"><a href="#estimate_importances_minibatches-755"><span class="linenos">755</span></a>        <span class="n">GLOBAL_RARE_VALUE_STORAGE</span><span class="o">.</span><span class="n">copy</span><span class="p">(),</span>
+</span><span id="estimate_importances_minibatches-756"><a href="#estimate_importances_minibatches-756"><span class="linenos">756</span></a>        <span class="n">GLOBAL_PRIOR_COMB_COUNTS</span><span class="o">.</span><span class="n">copy</span><span class="p">(),</span>
+</span><span id="estimate_importances_minibatches-757"><a href="#estimate_importances_minibatches-757"><span class="linenos">757</span></a>        <span class="n">GLOBAL_COUNTS_STORAGE</span><span class="o">.</span><span class="n">copy</span><span class="p">(),</span>
+</span><span id="estimate_importances_minibatches-758"><a href="#estimate_importances_minibatches-758"><span class="linenos">758</span></a>    <span class="p">)</span>
 </span></pre></div>
 
 
@@ -2183,4 +2164,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/core_selftest.html b/docs/outrank/core_selftest.html
index 47af91f..a1cca67 100644
--- a/docs/outrank/core_selftest.html
+++ b/docs/outrank/core_selftest.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.core_selftest API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -42,7 +42,7 @@
                     <h1 class="modulename">
 <a href="./../outrank.html">outrank</a><wbr>.core_selftest    </h1>
 
-
+                
                         <input id="mod-core_selftest-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 
                         <label class="view-source-button" for="mod-core_selftest-view-source"><span>View Source</span></label>
@@ -236,4 +236,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/core_utils.html b/docs/outrank/core_utils.html
index 21ee6b7..c2dc080 100644
--- a/docs/outrank/core_utils.html
+++ b/docs/outrank/core_utils.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.core_utils API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -174,6 +174,12 @@ <h2>API Documentation</h2>
             <li>
                     <a class="function" href="#summarize_rare_counts">summarize_rare_counts</a>
             </li>
+            <li>
+                    <a class="function" href="#is_prior_heuristic">is_prior_heuristic</a>
+            </li>
+            <li>
+                    <a class="function" href="#get_num_of_instances">get_num_of_instances</a>
+            </li>
     </ul>
 
 
@@ -190,7 +196,7 @@ <h2>API Documentation</h2>
                     <h1 class="modulename">
 <a href="./../outrank.html">outrank</a><wbr>.core_utils    </h1>
 
-
+                
                         <input id="mod-core_utils-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 
                         <label class="view-source-button" for="mod-core_utils-view-source"><span>View Source</span></label>
@@ -590,7 +596,7 @@ <h1 class="modulename">
 </span><span id="L-393"><a href="#L-393"><span class="linenos">393</span></a>    <span class="p">)</span>
 </span><span id="L-394"><a href="#L-394"><span class="linenos">394</span></a>
 </span><span id="L-395"><a href="#L-395"><span class="linenos">395</span></a>
-</span><span id="L-396"><a href="#L-396"><span class="linenos">396</span></a><span class="k">def</span> <span class="nf">extract_features_from_reference_JSON</span><span class="p">(</span><span class="n">json_path</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">combined_features_only</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">set</span><span class="p">[</span><span class="n">Any</span><span class="p">]:</span>
+</span><span id="L-396"><a href="#L-396"><span class="linenos">396</span></a><span class="k">def</span> <span class="nf">extract_features_from_reference_JSON</span><span class="p">(</span><span class="n">json_path</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">combined_features_only</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span> <span class="n">all_features</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">set</span><span class="p">[</span><span class="n">Any</span><span class="p">]:</span>
 </span><span id="L-397"><a href="#L-397"><span class="linenos">397</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Given a model&#39;s JSON, extract unique features&quot;&quot;&quot;</span>
 </span><span id="L-398"><a href="#L-398"><span class="linenos">398</span></a>
 </span><span id="L-399"><a href="#L-399"><span class="linenos">399</span></a>    <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">json_path</span><span class="p">)</span> <span class="k">as</span> <span class="n">jp</span><span class="p">:</span>
@@ -598,246 +604,270 @@ <h1 class="modulename">
 </span><span id="L-401"><a href="#L-401"><span class="linenos">401</span></a>
 </span><span id="L-402"><a href="#L-402"><span class="linenos">402</span></a>    <span class="n">unique_features</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span>
 </span><span id="L-403"><a href="#L-403"><span class="linenos">403</span></a>    <span class="n">feature_space</span> <span class="o">=</span> <span class="n">content</span><span class="p">[</span><span class="s1">&#39;desc&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;features&#39;</span><span class="p">,</span> <span class="p">[])</span>
-</span><span id="L-404"><a href="#L-404"><span class="linenos">404</span></a>    <span class="n">fields_space</span> <span class="o">=</span> <span class="n">content</span><span class="p">[</span><span class="s1">&#39;desc&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;fields&#39;</span><span class="p">,</span> <span class="p">[])</span>
-</span><span id="L-405"><a href="#L-405"><span class="linenos">405</span></a>    <span class="n">joint_space</span> <span class="o">=</span> <span class="n">feature_space</span> <span class="o">+</span> <span class="n">fields_space</span>
+</span><span id="L-404"><a href="#L-404"><span class="linenos">404</span></a>    <span class="k">if</span> <span class="n">all_features</span><span class="p">:</span>
+</span><span id="L-405"><a href="#L-405"><span class="linenos">405</span></a>        <span class="k">return</span> <span class="nb">set</span><span class="p">(</span><span class="n">feature_space</span><span class="p">)</span>
 </span><span id="L-406"><a href="#L-406"><span class="linenos">406</span></a>
-</span><span id="L-407"><a href="#L-407"><span class="linenos">407</span></a>    <span class="k">if</span> <span class="n">combined_features_only</span><span class="p">:</span>
-</span><span id="L-408"><a href="#L-408"><span class="linenos">408</span></a>        <span class="k">return</span> <span class="p">{</span><span class="n">feature</span> <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">feature_space</span> <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))</span><span class="o">&gt;</span><span class="mi">1</span><span class="p">}</span>
+</span><span id="L-407"><a href="#L-407"><span class="linenos">407</span></a>    <span class="n">fields_space</span> <span class="o">=</span> <span class="n">content</span><span class="p">[</span><span class="s1">&#39;desc&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;fields&#39;</span><span class="p">,</span> <span class="p">[])</span>
+</span><span id="L-408"><a href="#L-408"><span class="linenos">408</span></a>    <span class="n">joint_space</span> <span class="o">=</span> <span class="n">feature_space</span> <span class="o">+</span> <span class="n">fields_space</span>
 </span><span id="L-409"><a href="#L-409"><span class="linenos">409</span></a>
-</span><span id="L-410"><a href="#L-410"><span class="linenos">410</span></a>    <span class="k">for</span> <span class="n">feature_tuple</span> <span class="ow">in</span> <span class="n">joint_space</span><span class="p">:</span>
-</span><span id="L-411"><a href="#L-411"><span class="linenos">411</span></a>        <span class="k">for</span> <span class="n">individual_feature</span> <span class="ow">in</span> <span class="n">feature_tuple</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">):</span>
-</span><span id="L-412"><a href="#L-412"><span class="linenos">412</span></a>            <span class="n">unique_features</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">individual_feature</span><span class="p">)</span>
-</span><span id="L-413"><a href="#L-413"><span class="linenos">413</span></a>
-</span><span id="L-414"><a href="#L-414"><span class="linenos">414</span></a>    <span class="k">return</span> <span class="n">unique_features</span>
-</span><span id="L-415"><a href="#L-415"><span class="linenos">415</span></a>
+</span><span id="L-410"><a href="#L-410"><span class="linenos">410</span></a>    <span class="k">if</span> <span class="n">combined_features_only</span><span class="p">:</span>
+</span><span id="L-411"><a href="#L-411"><span class="linenos">411</span></a>        <span class="k">return</span> <span class="p">{</span><span class="n">feature</span> <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">feature_space</span> <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))</span><span class="o">&gt;</span><span class="mi">1</span><span class="p">}</span>
+</span><span id="L-412"><a href="#L-412"><span class="linenos">412</span></a>
+</span><span id="L-413"><a href="#L-413"><span class="linenos">413</span></a>    <span class="k">for</span> <span class="n">feature_tuple</span> <span class="ow">in</span> <span class="n">joint_space</span><span class="p">:</span>
+</span><span id="L-414"><a href="#L-414"><span class="linenos">414</span></a>        <span class="k">for</span> <span class="n">individual_feature</span> <span class="ow">in</span> <span class="n">feature_tuple</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">):</span>
+</span><span id="L-415"><a href="#L-415"><span class="linenos">415</span></a>            <span class="n">unique_features</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">individual_feature</span><span class="p">)</span>
 </span><span id="L-416"><a href="#L-416"><span class="linenos">416</span></a>
-</span><span id="L-417"><a href="#L-417"><span class="linenos">417</span></a><span class="k">def</span> <span class="nf">summarize_feature_bounds_for_transformers</span><span class="p">(</span>
-</span><span id="L-418"><a href="#L-418"><span class="linenos">418</span></a>    <span class="n">bounds_object_storage</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="L-419"><a href="#L-419"><span class="linenos">419</span></a>    <span class="n">feature_types</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
-</span><span id="L-420"><a href="#L-420"><span class="linenos">420</span></a>    <span class="n">task_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="L-421"><a href="#L-421"><span class="linenos">421</span></a>    <span class="n">label_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="L-422"><a href="#L-422"><span class="linenos">422</span></a>    <span class="n">granularity</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">15</span><span class="p">,</span>
-</span><span id="L-423"><a href="#L-423"><span class="linenos">423</span></a>    <span class="n">output_summary_table_only</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="L-424"><a href="#L-424"><span class="linenos">424</span></a><span class="p">):</span>
-</span><span id="L-425"><a href="#L-425"><span class="linenos">425</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;summarization auxilliary method for generating JSON-based specs&quot;&quot;&quot;</span>
-</span><span id="L-426"><a href="#L-426"><span class="linenos">426</span></a>
-</span><span id="L-427"><a href="#L-427"><span class="linenos">427</span></a>    <span class="k">if</span> <span class="n">bounds_object_storage</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-428"><a href="#L-428"><span class="linenos">428</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Bounds storage object is empty.&#39;</span><span class="p">)</span>
-</span><span id="L-429"><a href="#L-429"><span class="linenos">429</span></a>        <span class="n">exit</span><span class="p">()</span>
-</span><span id="L-430"><a href="#L-430"><span class="linenos">430</span></a>
-</span><span id="L-431"><a href="#L-431"><span class="linenos">431</span></a>    <span class="n">final_storage</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
-</span><span id="L-432"><a href="#L-432"><span class="linenos">432</span></a>    <span class="k">for</span> <span class="n">el</span> <span class="ow">in</span> <span class="n">bounds_object_storage</span><span class="p">:</span>
-</span><span id="L-433"><a href="#L-433"><span class="linenos">433</span></a>        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">el</span><span class="p">,</span> <span class="nb">dict</span><span class="p">):</span>
-</span><span id="L-434"><a href="#L-434"><span class="linenos">434</span></a>            <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">el</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="L-435"><a href="#L-435"><span class="linenos">435</span></a>                <span class="n">final_storage</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">v</span><span class="p">)</span>
-</span><span id="L-436"><a href="#L-436"><span class="linenos">436</span></a>
-</span><span id="L-437"><a href="#L-437"><span class="linenos">437</span></a>    <span class="n">summary_table_rows</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-438"><a href="#L-438"><span class="linenos">438</span></a>    <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">final_storage</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="L-439"><a href="#L-439"><span class="linenos">439</span></a>        <span class="c1"># Conduct local aggregation + bound changes</span>
-</span><span id="L-440"><a href="#L-440"><span class="linenos">440</span></a>        <span class="k">if</span> <span class="n">k</span> <span class="ow">in</span> <span class="n">feature_types</span> <span class="ow">and</span> <span class="n">k</span> <span class="o">!=</span> <span class="n">label_name</span><span class="p">:</span>
-</span><span id="L-441"><a href="#L-441"><span class="linenos">441</span></a>            <span class="n">minima</span><span class="p">,</span> <span class="n">maxima</span><span class="p">,</span> <span class="n">medians</span><span class="p">,</span> <span class="n">uniques</span> <span class="o">=</span> <span class="p">[],</span> <span class="p">[],</span> <span class="p">[],</span> <span class="p">[]</span>
-</span><span id="L-442"><a href="#L-442"><span class="linenos">442</span></a>            <span class="k">for</span> <span class="n">feature_summary</span> <span class="ow">in</span> <span class="n">v</span><span class="p">:</span>
-</span><span id="L-443"><a href="#L-443"><span class="linenos">443</span></a>                <span class="n">minima</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">feature_summary</span><span class="o">.</span><span class="n">minimum</span><span class="p">)</span>
-</span><span id="L-444"><a href="#L-444"><span class="linenos">444</span></a>                <span class="n">maxima</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">feature_summary</span><span class="o">.</span><span class="n">maximum</span><span class="p">)</span>
-</span><span id="L-445"><a href="#L-445"><span class="linenos">445</span></a>                <span class="n">medians</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">feature_summary</span><span class="o">.</span><span class="n">median</span><span class="p">)</span>
-</span><span id="L-446"><a href="#L-446"><span class="linenos">446</span></a>                <span class="n">uniques</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">feature_summary</span><span class="o">.</span><span class="n">num_unique</span><span class="p">)</span>
-</span><span id="L-447"><a href="#L-447"><span class="linenos">447</span></a>            <span class="n">summary_table_rows</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-</span><span id="L-448"><a href="#L-448"><span class="linenos">448</span></a>                <span class="p">[</span>
-</span><span id="L-449"><a href="#L-449"><span class="linenos">449</span></a>                    <span class="n">k</span><span class="p">,</span>
-</span><span id="L-450"><a href="#L-450"><span class="linenos">450</span></a>                    <span class="nb">round</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">(</span><span class="n">minima</span><span class="p">),</span> <span class="mi">2</span><span class="p">),</span>
-</span><span id="L-451"><a href="#L-451"><span class="linenos">451</span></a>                    <span class="nb">round</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">maxima</span><span class="p">),</span> <span class="mi">2</span><span class="p">),</span>
-</span><span id="L-452"><a href="#L-452"><span class="linenos">452</span></a>                    <span class="nb">round</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="n">medians</span><span class="p">),</span> <span class="mi">2</span><span class="p">),</span>
-</span><span id="L-453"><a href="#L-453"><span class="linenos">453</span></a>                    <span class="nb">int</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">uniques</span><span class="p">)),</span>
-</span><span id="L-454"><a href="#L-454"><span class="linenos">454</span></a>                <span class="p">],</span>
-</span><span id="L-455"><a href="#L-455"><span class="linenos">455</span></a>            <span class="p">)</span>
-</span><span id="L-456"><a href="#L-456"><span class="linenos">456</span></a>
-</span><span id="L-457"><a href="#L-457"><span class="linenos">457</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">summary_table_rows</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="L-458"><a href="#L-458"><span class="linenos">458</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;No numeric features to summarize.&#39;</span><span class="p">)</span>
-</span><span id="L-459"><a href="#L-459"><span class="linenos">459</span></a>        <span class="k">return</span> <span class="kc">None</span>
-</span><span id="L-460"><a href="#L-460"><span class="linenos">460</span></a>
-</span><span id="L-461"><a href="#L-461"><span class="linenos">461</span></a>    <span class="n">summary_table</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">summary_table_rows</span><span class="p">)</span>
-</span><span id="L-462"><a href="#L-462"><span class="linenos">462</span></a>    <span class="n">summary_table</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="L-463"><a href="#L-463"><span class="linenos">463</span></a>        <span class="s1">&#39;Feature&#39;</span><span class="p">,</span>
-</span><span id="L-464"><a href="#L-464"><span class="linenos">464</span></a>        <span class="s1">&#39;Minimum&#39;</span><span class="p">,</span>
-</span><span id="L-465"><a href="#L-465"><span class="linenos">465</span></a>        <span class="s1">&#39;Maximum&#39;</span><span class="p">,</span>
-</span><span id="L-466"><a href="#L-466"><span class="linenos">466</span></a>        <span class="s1">&#39;Median&#39;</span><span class="p">,</span>
-</span><span id="L-467"><a href="#L-467"><span class="linenos">467</span></a>        <span class="s1">&#39;Num avg. unique (batch)&#39;</span><span class="p">,</span>
-</span><span id="L-468"><a href="#L-468"><span class="linenos">468</span></a>    <span class="p">]</span>
-</span><span id="L-469"><a href="#L-469"><span class="linenos">469</span></a>
-</span><span id="L-470"><a href="#L-470"><span class="linenos">470</span></a>    <span class="k">if</span> <span class="n">output_summary_table_only</span><span class="p">:</span>
-</span><span id="L-471"><a href="#L-471"><span class="linenos">471</span></a>        <span class="k">return</span> <span class="n">summary_table</span>
+</span><span id="L-417"><a href="#L-417"><span class="linenos">417</span></a>    <span class="k">return</span> <span class="n">unique_features</span>
+</span><span id="L-418"><a href="#L-418"><span class="linenos">418</span></a>
+</span><span id="L-419"><a href="#L-419"><span class="linenos">419</span></a>
+</span><span id="L-420"><a href="#L-420"><span class="linenos">420</span></a><span class="k">def</span> <span class="nf">summarize_feature_bounds_for_transformers</span><span class="p">(</span>
+</span><span id="L-421"><a href="#L-421"><span class="linenos">421</span></a>    <span class="n">bounds_object_storage</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="L-422"><a href="#L-422"><span class="linenos">422</span></a>    <span class="n">feature_types</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
+</span><span id="L-423"><a href="#L-423"><span class="linenos">423</span></a>    <span class="n">task_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="L-424"><a href="#L-424"><span class="linenos">424</span></a>    <span class="n">label_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="L-425"><a href="#L-425"><span class="linenos">425</span></a>    <span class="n">granularity</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">15</span><span class="p">,</span>
+</span><span id="L-426"><a href="#L-426"><span class="linenos">426</span></a>    <span class="n">output_summary_table_only</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-427"><a href="#L-427"><span class="linenos">427</span></a><span class="p">):</span>
+</span><span id="L-428"><a href="#L-428"><span class="linenos">428</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;summarization auxilliary method for generating JSON-based specs&quot;&quot;&quot;</span>
+</span><span id="L-429"><a href="#L-429"><span class="linenos">429</span></a>
+</span><span id="L-430"><a href="#L-430"><span class="linenos">430</span></a>    <span class="k">if</span> <span class="n">bounds_object_storage</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-431"><a href="#L-431"><span class="linenos">431</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Bounds storage object is empty.&#39;</span><span class="p">)</span>
+</span><span id="L-432"><a href="#L-432"><span class="linenos">432</span></a>        <span class="n">exit</span><span class="p">()</span>
+</span><span id="L-433"><a href="#L-433"><span class="linenos">433</span></a>
+</span><span id="L-434"><a href="#L-434"><span class="linenos">434</span></a>    <span class="n">final_storage</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
+</span><span id="L-435"><a href="#L-435"><span class="linenos">435</span></a>    <span class="k">for</span> <span class="n">el</span> <span class="ow">in</span> <span class="n">bounds_object_storage</span><span class="p">:</span>
+</span><span id="L-436"><a href="#L-436"><span class="linenos">436</span></a>        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">el</span><span class="p">,</span> <span class="nb">dict</span><span class="p">):</span>
+</span><span id="L-437"><a href="#L-437"><span class="linenos">437</span></a>            <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">el</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-438"><a href="#L-438"><span class="linenos">438</span></a>                <span class="n">final_storage</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">v</span><span class="p">)</span>
+</span><span id="L-439"><a href="#L-439"><span class="linenos">439</span></a>
+</span><span id="L-440"><a href="#L-440"><span class="linenos">440</span></a>    <span class="n">summary_table_rows</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-441"><a href="#L-441"><span class="linenos">441</span></a>    <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">final_storage</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-442"><a href="#L-442"><span class="linenos">442</span></a>        <span class="c1"># Conduct local aggregation + bound changes</span>
+</span><span id="L-443"><a href="#L-443"><span class="linenos">443</span></a>        <span class="k">if</span> <span class="n">k</span> <span class="ow">in</span> <span class="n">feature_types</span> <span class="ow">and</span> <span class="n">k</span> <span class="o">!=</span> <span class="n">label_name</span><span class="p">:</span>
+</span><span id="L-444"><a href="#L-444"><span class="linenos">444</span></a>            <span class="n">minima</span><span class="p">,</span> <span class="n">maxima</span><span class="p">,</span> <span class="n">medians</span><span class="p">,</span> <span class="n">uniques</span> <span class="o">=</span> <span class="p">[],</span> <span class="p">[],</span> <span class="p">[],</span> <span class="p">[]</span>
+</span><span id="L-445"><a href="#L-445"><span class="linenos">445</span></a>            <span class="k">for</span> <span class="n">feature_summary</span> <span class="ow">in</span> <span class="n">v</span><span class="p">:</span>
+</span><span id="L-446"><a href="#L-446"><span class="linenos">446</span></a>                <span class="n">minima</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">feature_summary</span><span class="o">.</span><span class="n">minimum</span><span class="p">)</span>
+</span><span id="L-447"><a href="#L-447"><span class="linenos">447</span></a>                <span class="n">maxima</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">feature_summary</span><span class="o">.</span><span class="n">maximum</span><span class="p">)</span>
+</span><span id="L-448"><a href="#L-448"><span class="linenos">448</span></a>                <span class="n">medians</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">feature_summary</span><span class="o">.</span><span class="n">median</span><span class="p">)</span>
+</span><span id="L-449"><a href="#L-449"><span class="linenos">449</span></a>                <span class="n">uniques</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">feature_summary</span><span class="o">.</span><span class="n">num_unique</span><span class="p">)</span>
+</span><span id="L-450"><a href="#L-450"><span class="linenos">450</span></a>            <span class="n">summary_table_rows</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
+</span><span id="L-451"><a href="#L-451"><span class="linenos">451</span></a>                <span class="p">[</span>
+</span><span id="L-452"><a href="#L-452"><span class="linenos">452</span></a>                    <span class="n">k</span><span class="p">,</span>
+</span><span id="L-453"><a href="#L-453"><span class="linenos">453</span></a>                    <span class="nb">round</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">(</span><span class="n">minima</span><span class="p">),</span> <span class="mi">2</span><span class="p">),</span>
+</span><span id="L-454"><a href="#L-454"><span class="linenos">454</span></a>                    <span class="nb">round</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">maxima</span><span class="p">),</span> <span class="mi">2</span><span class="p">),</span>
+</span><span id="L-455"><a href="#L-455"><span class="linenos">455</span></a>                    <span class="nb">round</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="n">medians</span><span class="p">),</span> <span class="mi">2</span><span class="p">),</span>
+</span><span id="L-456"><a href="#L-456"><span class="linenos">456</span></a>                    <span class="nb">int</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">uniques</span><span class="p">)),</span>
+</span><span id="L-457"><a href="#L-457"><span class="linenos">457</span></a>                <span class="p">],</span>
+</span><span id="L-458"><a href="#L-458"><span class="linenos">458</span></a>            <span class="p">)</span>
+</span><span id="L-459"><a href="#L-459"><span class="linenos">459</span></a>
+</span><span id="L-460"><a href="#L-460"><span class="linenos">460</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">summary_table_rows</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-461"><a href="#L-461"><span class="linenos">461</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;No numeric features to summarize.&#39;</span><span class="p">)</span>
+</span><span id="L-462"><a href="#L-462"><span class="linenos">462</span></a>        <span class="k">return</span> <span class="kc">None</span>
+</span><span id="L-463"><a href="#L-463"><span class="linenos">463</span></a>
+</span><span id="L-464"><a href="#L-464"><span class="linenos">464</span></a>    <span class="n">summary_table</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">summary_table_rows</span><span class="p">)</span>
+</span><span id="L-465"><a href="#L-465"><span class="linenos">465</span></a>    <span class="n">summary_table</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="L-466"><a href="#L-466"><span class="linenos">466</span></a>        <span class="s1">&#39;Feature&#39;</span><span class="p">,</span>
+</span><span id="L-467"><a href="#L-467"><span class="linenos">467</span></a>        <span class="s1">&#39;Minimum&#39;</span><span class="p">,</span>
+</span><span id="L-468"><a href="#L-468"><span class="linenos">468</span></a>        <span class="s1">&#39;Maximum&#39;</span><span class="p">,</span>
+</span><span id="L-469"><a href="#L-469"><span class="linenos">469</span></a>        <span class="s1">&#39;Median&#39;</span><span class="p">,</span>
+</span><span id="L-470"><a href="#L-470"><span class="linenos">470</span></a>        <span class="s1">&#39;Num avg. unique (batch)&#39;</span><span class="p">,</span>
+</span><span id="L-471"><a href="#L-471"><span class="linenos">471</span></a>    <span class="p">]</span>
 </span><span id="L-472"><a href="#L-472"><span class="linenos">472</span></a>
-</span><span id="L-473"><a href="#L-473"><span class="linenos">473</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">summary_table</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="L-474"><a href="#L-474"><span class="linenos">474</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Summary table empty, skipping transformer generation ..&#39;</span><span class="p">)</span>
-</span><span id="L-475"><a href="#L-475"><span class="linenos">475</span></a>        <span class="k">return</span>
-</span><span id="L-476"><a href="#L-476"><span class="linenos">476</span></a>
-</span><span id="L-477"><a href="#L-477"><span class="linenos">477</span></a>    <span class="k">if</span> <span class="n">task_name</span> <span class="o">==</span> <span class="s1">&#39;feature_summary_transformers&#39;</span><span class="p">:</span>
-</span><span id="L-478"><a href="#L-478"><span class="linenos">478</span></a>        <span class="n">transformers_per_feature</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
+</span><span id="L-473"><a href="#L-473"><span class="linenos">473</span></a>    <span class="k">if</span> <span class="n">output_summary_table_only</span><span class="p">:</span>
+</span><span id="L-474"><a href="#L-474"><span class="linenos">474</span></a>        <span class="k">return</span> <span class="n">summary_table</span>
+</span><span id="L-475"><a href="#L-475"><span class="linenos">475</span></a>
+</span><span id="L-476"><a href="#L-476"><span class="linenos">476</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">summary_table</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-477"><a href="#L-477"><span class="linenos">477</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Summary table empty, skipping transformer generation ..&#39;</span><span class="p">)</span>
+</span><span id="L-478"><a href="#L-478"><span class="linenos">478</span></a>        <span class="k">return</span>
 </span><span id="L-479"><a href="#L-479"><span class="linenos">479</span></a>
-</span><span id="L-480"><a href="#L-480"><span class="linenos">480</span></a>        <span class="c1"># Take care of weights first -&gt; range is pre-defined</span>
-</span><span id="L-481"><a href="#L-481"><span class="linenos">481</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">final_storage</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="L-482"><a href="#L-482"><span class="linenos">482</span></a>            <span class="k">if</span> <span class="n">label_name</span> <span class="ow">in</span> <span class="n">k</span> <span class="ow">or</span> <span class="s1">&#39;dummy&#39;</span> <span class="ow">in</span> <span class="n">k</span><span class="p">:</span>
-</span><span id="L-483"><a href="#L-483"><span class="linenos">483</span></a>                <span class="k">continue</span>
-</span><span id="L-484"><a href="#L-484"><span class="linenos">484</span></a>
-</span><span id="L-485"><a href="#L-485"><span class="linenos">485</span></a>            <span class="n">weight_template</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="L-486"><a href="#L-486"><span class="linenos">486</span></a>                <span class="s1">&#39;feature&#39;</span><span class="p">:</span> <span class="n">k</span><span class="p">,</span>
-</span><span id="L-487"><a href="#L-487"><span class="linenos">487</span></a>                <span class="s1">&#39;src_features&#39;</span><span class="p">:</span> <span class="p">[</span><span class="n">k</span><span class="p">],</span>
-</span><span id="L-488"><a href="#L-488"><span class="linenos">488</span></a>                <span class="s1">&#39;transformations&#39;</span><span class="p">:</span> <span class="p">[</span><span class="s1">&#39;Weight&#39;</span><span class="p">],</span>
-</span><span id="L-489"><a href="#L-489"><span class="linenos">489</span></a>                <span class="s1">&#39;weights&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">,</span> <span class="mf">1.5</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">3</span><span class="p">,</span> <span class="mi">10</span><span class="p">],</span>
-</span><span id="L-490"><a href="#L-490"><span class="linenos">490</span></a>            <span class="p">}</span>
-</span><span id="L-491"><a href="#L-491"><span class="linenos">491</span></a>            <span class="n">transformers_per_feature</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">weight_template</span><span class="p">)</span>
-</span><span id="L-492"><a href="#L-492"><span class="linenos">492</span></a>
-</span><span id="L-493"><a href="#L-493"><span class="linenos">493</span></a>        <span class="c1"># Consider numeric transformations - pairs and single ones</span>
-</span><span id="L-494"><a href="#L-494"><span class="linenos">494</span></a>        <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">summary_table</span><span class="o">.</span><span class="n">iterrows</span><span class="p">():</span>
-</span><span id="L-495"><a href="#L-495"><span class="linenos">495</span></a>            <span class="k">if</span> <span class="n">row</span><span class="o">.</span><span class="n">Feature</span> <span class="o">==</span> <span class="s1">&#39;dummy&#39;</span><span class="p">:</span>
-</span><span id="L-496"><a href="#L-496"><span class="linenos">496</span></a>                <span class="k">continue</span>
-</span><span id="L-497"><a href="#L-497"><span class="linenos">497</span></a>            <span class="k">try</span><span class="p">:</span>
-</span><span id="L-498"><a href="#L-498"><span class="linenos">498</span></a>                <span class="n">actual_range</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="L-499"><a href="#L-499"><span class="linenos">499</span></a>                    <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span>
-</span><span id="L-500"><a href="#L-500"><span class="linenos">500</span></a>                        <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Minimum&#39;</span><span class="p">],</span>
-</span><span id="L-501"><a href="#L-501"><span class="linenos">501</span></a>                        <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Maximum&#39;</span><span class="p">],</span>
-</span><span id="L-502"><a href="#L-502"><span class="linenos">502</span></a>                        <span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s1">&#39;Maximum&#39;</span><span class="p">]</span> <span class="o">-</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Minimum&#39;</span><span class="p">])</span> <span class="o">/</span> <span class="n">granularity</span><span class="p">,</span>
-</span><span id="L-503"><a href="#L-503"><span class="linenos">503</span></a>                    <span class="p">)</span>
-</span><span id="L-504"><a href="#L-504"><span class="linenos">504</span></a>                    <span class="o">.</span><span class="n">round</span><span class="p">(</span><span class="mi">2</span><span class="p">)</span>
-</span><span id="L-505"><a href="#L-505"><span class="linenos">505</span></a>                    <span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="L-506"><a href="#L-506"><span class="linenos">506</span></a>                <span class="p">)</span>
-</span><span id="L-507"><a href="#L-507"><span class="linenos">507</span></a>                <span class="n">binner_template</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="L-508"><a href="#L-508"><span class="linenos">508</span></a>                    <span class="s1">&#39;feature&#39;</span><span class="p">:</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="L-509"><a href="#L-509"><span class="linenos">509</span></a>                    <span class="s1">&#39;src_features&#39;</span><span class="p">:</span> <span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">],</span>
-</span><span id="L-510"><a href="#L-510"><span class="linenos">510</span></a>                    <span class="s1">&#39;transformations&#39;</span><span class="p">:</span> <span class="p">[</span>
-</span><span id="L-511"><a href="#L-511"><span class="linenos">511</span></a>                        <span class="s1">&#39;BinnerSqrt&#39;</span><span class="p">,</span>
-</span><span id="L-512"><a href="#L-512"><span class="linenos">512</span></a>                        <span class="s1">&#39;BinnerLog&#39;</span><span class="p">,</span>
-</span><span id="L-513"><a href="#L-513"><span class="linenos">513</span></a>                        <span class="s1">&#39;BinnerSqrtPlain&#39;</span><span class="p">,</span>
-</span><span id="L-514"><a href="#L-514"><span class="linenos">514</span></a>                        <span class="s1">&#39;BinnerLogPlain&#39;</span><span class="p">,</span>
-</span><span id="L-515"><a href="#L-515"><span class="linenos">515</span></a>                    <span class="p">],</span>
-</span><span id="L-516"><a href="#L-516"><span class="linenos">516</span></a>                    <span class="s1">&#39;n&#39;</span><span class="p">:</span> <span class="n">actual_range</span><span class="p">,</span>
-</span><span id="L-517"><a href="#L-517"><span class="linenos">517</span></a>                    <span class="s1">&#39;resolutions&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mf">0.1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">8</span><span class="p">,</span> <span class="mi">16</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">64</span><span class="p">,</span> <span class="mi">128</span><span class="p">],</span>
-</span><span id="L-518"><a href="#L-518"><span class="linenos">518</span></a>                <span class="p">}</span>
-</span><span id="L-519"><a href="#L-519"><span class="linenos">519</span></a>
-</span><span id="L-520"><a href="#L-520"><span class="linenos">520</span></a>            <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">es</span><span class="p">:</span>
-</span><span id="L-521"><a href="#L-521"><span class="linenos">521</span></a>                <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="L-522"><a href="#L-522"><span class="linenos">522</span></a>                    <span class="sa">f</span><span class="s1">&#39;</span><span class="se">\U0001F631</span><span class="s1"> Encountered </span><span class="si">{</span><span class="n">es</span><span class="si">}</span><span class="s1">. The problematic feature is: </span><span class="si">{</span><span class="n">row</span><span class="si">}</span><span class="s1">, skipping transformer for this feature ..&#39;</span><span class="p">,</span>
-</span><span id="L-523"><a href="#L-523"><span class="linenos">523</span></a>                <span class="p">)</span>
-</span><span id="L-524"><a href="#L-524"><span class="linenos">524</span></a>
-</span><span id="L-525"><a href="#L-525"><span class="linenos">525</span></a>            <span class="n">transformers_per_feature</span><span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">binner_template</span><span class="p">)</span>
-</span><span id="L-526"><a href="#L-526"><span class="linenos">526</span></a>
-</span><span id="L-527"><a href="#L-527"><span class="linenos">527</span></a>            <span class="c1"># We want the full loop here, due to asymmetry of transformation(s)</span>
-</span><span id="L-528"><a href="#L-528"><span class="linenos">528</span></a>            <span class="k">for</span> <span class="n">enx_second</span><span class="p">,</span> <span class="n">row_second</span> <span class="ow">in</span> <span class="n">summary_table</span><span class="o">.</span><span class="n">iterrows</span><span class="p">():</span>
-</span><span id="L-529"><a href="#L-529"><span class="linenos">529</span></a>                <span class="k">if</span> <span class="n">enx_second</span> <span class="o">&lt;</span> <span class="n">enx</span><span class="p">:</span>
-</span><span id="L-530"><a href="#L-530"><span class="linenos">530</span></a>                    <span class="k">continue</span>
-</span><span id="L-531"><a href="#L-531"><span class="linenos">531</span></a>
-</span><span id="L-532"><a href="#L-532"><span class="linenos">532</span></a>                <span class="c1"># The n values are defined based on maxima of the second feature</span>
-</span><span id="L-533"><a href="#L-533"><span class="linenos">533</span></a>                <span class="k">if</span> <span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span> <span class="o">!=</span> <span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">:</span>
-</span><span id="L-534"><a href="#L-534"><span class="linenos">534</span></a>                    <span class="n">n_bound</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">row_second</span><span class="p">[</span><span class="s1">&#39;Median&#39;</span><span class="p">]</span> <span class="o">+</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Median&#39;</span><span class="p">],</span> <span class="mi">2</span><span class="p">)</span>
-</span><span id="L-535"><a href="#L-535"><span class="linenos">535</span></a>                    <span class="n">max_bound</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span>
-</span><span id="L-536"><a href="#L-536"><span class="linenos">536</span></a>                        <span class="nb">min</span><span class="p">(</span><span class="n">row_second</span><span class="p">[</span><span class="s1">&#39;Maximum&#39;</span><span class="p">],</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Maximum&#39;</span><span class="p">]),</span> <span class="mi">2</span><span class="p">,</span>
-</span><span id="L-537"><a href="#L-537"><span class="linenos">537</span></a>                    <span class="p">)</span>
-</span><span id="L-538"><a href="#L-538"><span class="linenos">538</span></a>                    <span class="n">min_bound</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span>
-</span><span id="L-539"><a href="#L-539"><span class="linenos">539</span></a>                        <span class="n">row_second</span><span class="p">[</span><span class="s1">&#39;Minimum&#39;</span><span class="p">]</span> <span class="o">+</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Minimum&#39;</span><span class="p">],</span> <span class="mi">2</span><span class="p">,</span>
+</span><span id="L-480"><a href="#L-480"><span class="linenos">480</span></a>    <span class="k">if</span> <span class="n">task_name</span> <span class="o">==</span> <span class="s1">&#39;feature_summary_transformers&#39;</span><span class="p">:</span>
+</span><span id="L-481"><a href="#L-481"><span class="linenos">481</span></a>        <span class="n">transformers_per_feature</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
+</span><span id="L-482"><a href="#L-482"><span class="linenos">482</span></a>
+</span><span id="L-483"><a href="#L-483"><span class="linenos">483</span></a>        <span class="c1"># Take care of weights first -&gt; range is pre-defined</span>
+</span><span id="L-484"><a href="#L-484"><span class="linenos">484</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">final_storage</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-485"><a href="#L-485"><span class="linenos">485</span></a>            <span class="k">if</span> <span class="n">label_name</span> <span class="ow">in</span> <span class="n">k</span> <span class="ow">or</span> <span class="s1">&#39;dummy&#39;</span> <span class="ow">in</span> <span class="n">k</span><span class="p">:</span>
+</span><span id="L-486"><a href="#L-486"><span class="linenos">486</span></a>                <span class="k">continue</span>
+</span><span id="L-487"><a href="#L-487"><span class="linenos">487</span></a>
+</span><span id="L-488"><a href="#L-488"><span class="linenos">488</span></a>            <span class="n">weight_template</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-489"><a href="#L-489"><span class="linenos">489</span></a>                <span class="s1">&#39;feature&#39;</span><span class="p">:</span> <span class="n">k</span><span class="p">,</span>
+</span><span id="L-490"><a href="#L-490"><span class="linenos">490</span></a>                <span class="s1">&#39;src_features&#39;</span><span class="p">:</span> <span class="p">[</span><span class="n">k</span><span class="p">],</span>
+</span><span id="L-491"><a href="#L-491"><span class="linenos">491</span></a>                <span class="s1">&#39;transformations&#39;</span><span class="p">:</span> <span class="p">[</span><span class="s1">&#39;Weight&#39;</span><span class="p">],</span>
+</span><span id="L-492"><a href="#L-492"><span class="linenos">492</span></a>                <span class="s1">&#39;weights&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">,</span> <span class="mf">1.5</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">3</span><span class="p">,</span> <span class="mi">10</span><span class="p">],</span>
+</span><span id="L-493"><a href="#L-493"><span class="linenos">493</span></a>            <span class="p">}</span>
+</span><span id="L-494"><a href="#L-494"><span class="linenos">494</span></a>            <span class="n">transformers_per_feature</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">weight_template</span><span class="p">)</span>
+</span><span id="L-495"><a href="#L-495"><span class="linenos">495</span></a>
+</span><span id="L-496"><a href="#L-496"><span class="linenos">496</span></a>        <span class="c1"># Consider numeric transformations - pairs and single ones</span>
+</span><span id="L-497"><a href="#L-497"><span class="linenos">497</span></a>        <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">summary_table</span><span class="o">.</span><span class="n">iterrows</span><span class="p">():</span>
+</span><span id="L-498"><a href="#L-498"><span class="linenos">498</span></a>            <span class="k">if</span> <span class="n">row</span><span class="o">.</span><span class="n">Feature</span> <span class="o">==</span> <span class="s1">&#39;dummy&#39;</span><span class="p">:</span>
+</span><span id="L-499"><a href="#L-499"><span class="linenos">499</span></a>                <span class="k">continue</span>
+</span><span id="L-500"><a href="#L-500"><span class="linenos">500</span></a>            <span class="k">try</span><span class="p">:</span>
+</span><span id="L-501"><a href="#L-501"><span class="linenos">501</span></a>                <span class="n">actual_range</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="L-502"><a href="#L-502"><span class="linenos">502</span></a>                    <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span>
+</span><span id="L-503"><a href="#L-503"><span class="linenos">503</span></a>                        <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Minimum&#39;</span><span class="p">],</span>
+</span><span id="L-504"><a href="#L-504"><span class="linenos">504</span></a>                        <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Maximum&#39;</span><span class="p">],</span>
+</span><span id="L-505"><a href="#L-505"><span class="linenos">505</span></a>                        <span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s1">&#39;Maximum&#39;</span><span class="p">]</span> <span class="o">-</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Minimum&#39;</span><span class="p">])</span> <span class="o">/</span> <span class="n">granularity</span><span class="p">,</span>
+</span><span id="L-506"><a href="#L-506"><span class="linenos">506</span></a>                    <span class="p">)</span>
+</span><span id="L-507"><a href="#L-507"><span class="linenos">507</span></a>                    <span class="o">.</span><span class="n">round</span><span class="p">(</span><span class="mi">2</span><span class="p">)</span>
+</span><span id="L-508"><a href="#L-508"><span class="linenos">508</span></a>                    <span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="L-509"><a href="#L-509"><span class="linenos">509</span></a>                <span class="p">)</span>
+</span><span id="L-510"><a href="#L-510"><span class="linenos">510</span></a>                <span class="n">binner_template</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-511"><a href="#L-511"><span class="linenos">511</span></a>                    <span class="s1">&#39;feature&#39;</span><span class="p">:</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="L-512"><a href="#L-512"><span class="linenos">512</span></a>                    <span class="s1">&#39;src_features&#39;</span><span class="p">:</span> <span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">],</span>
+</span><span id="L-513"><a href="#L-513"><span class="linenos">513</span></a>                    <span class="s1">&#39;transformations&#39;</span><span class="p">:</span> <span class="p">[</span>
+</span><span id="L-514"><a href="#L-514"><span class="linenos">514</span></a>                        <span class="s1">&#39;BinnerSqrt&#39;</span><span class="p">,</span>
+</span><span id="L-515"><a href="#L-515"><span class="linenos">515</span></a>                        <span class="s1">&#39;BinnerLog&#39;</span><span class="p">,</span>
+</span><span id="L-516"><a href="#L-516"><span class="linenos">516</span></a>                        <span class="s1">&#39;BinnerSqrtPlain&#39;</span><span class="p">,</span>
+</span><span id="L-517"><a href="#L-517"><span class="linenos">517</span></a>                        <span class="s1">&#39;BinnerLogPlain&#39;</span><span class="p">,</span>
+</span><span id="L-518"><a href="#L-518"><span class="linenos">518</span></a>                    <span class="p">],</span>
+</span><span id="L-519"><a href="#L-519"><span class="linenos">519</span></a>                    <span class="s1">&#39;n&#39;</span><span class="p">:</span> <span class="n">actual_range</span><span class="p">,</span>
+</span><span id="L-520"><a href="#L-520"><span class="linenos">520</span></a>                    <span class="s1">&#39;resolutions&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mf">0.1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">8</span><span class="p">,</span> <span class="mi">16</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">64</span><span class="p">,</span> <span class="mi">128</span><span class="p">],</span>
+</span><span id="L-521"><a href="#L-521"><span class="linenos">521</span></a>                <span class="p">}</span>
+</span><span id="L-522"><a href="#L-522"><span class="linenos">522</span></a>
+</span><span id="L-523"><a href="#L-523"><span class="linenos">523</span></a>            <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">es</span><span class="p">:</span>
+</span><span id="L-524"><a href="#L-524"><span class="linenos">524</span></a>                <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="L-525"><a href="#L-525"><span class="linenos">525</span></a>                    <span class="sa">f</span><span class="s1">&#39;</span><span class="se">\U0001F631</span><span class="s1"> Encountered </span><span class="si">{</span><span class="n">es</span><span class="si">}</span><span class="s1">. The problematic feature is: </span><span class="si">{</span><span class="n">row</span><span class="si">}</span><span class="s1">, skipping transformer for this feature ..&#39;</span><span class="p">,</span>
+</span><span id="L-526"><a href="#L-526"><span class="linenos">526</span></a>                <span class="p">)</span>
+</span><span id="L-527"><a href="#L-527"><span class="linenos">527</span></a>
+</span><span id="L-528"><a href="#L-528"><span class="linenos">528</span></a>            <span class="n">transformers_per_feature</span><span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">binner_template</span><span class="p">)</span>
+</span><span id="L-529"><a href="#L-529"><span class="linenos">529</span></a>
+</span><span id="L-530"><a href="#L-530"><span class="linenos">530</span></a>            <span class="c1"># We want the full loop here, due to asymmetry of transformation(s)</span>
+</span><span id="L-531"><a href="#L-531"><span class="linenos">531</span></a>            <span class="k">for</span> <span class="n">enx_second</span><span class="p">,</span> <span class="n">row_second</span> <span class="ow">in</span> <span class="n">summary_table</span><span class="o">.</span><span class="n">iterrows</span><span class="p">():</span>
+</span><span id="L-532"><a href="#L-532"><span class="linenos">532</span></a>                <span class="k">if</span> <span class="n">enx_second</span> <span class="o">&lt;</span> <span class="n">enx</span><span class="p">:</span>
+</span><span id="L-533"><a href="#L-533"><span class="linenos">533</span></a>                    <span class="k">continue</span>
+</span><span id="L-534"><a href="#L-534"><span class="linenos">534</span></a>
+</span><span id="L-535"><a href="#L-535"><span class="linenos">535</span></a>                <span class="c1"># The n values are defined based on maxima of the second feature</span>
+</span><span id="L-536"><a href="#L-536"><span class="linenos">536</span></a>                <span class="k">if</span> <span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span> <span class="o">!=</span> <span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">:</span>
+</span><span id="L-537"><a href="#L-537"><span class="linenos">537</span></a>                    <span class="n">n_bound</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">row_second</span><span class="p">[</span><span class="s1">&#39;Median&#39;</span><span class="p">]</span> <span class="o">+</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Median&#39;</span><span class="p">],</span> <span class="mi">2</span><span class="p">)</span>
+</span><span id="L-538"><a href="#L-538"><span class="linenos">538</span></a>                    <span class="n">max_bound</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span>
+</span><span id="L-539"><a href="#L-539"><span class="linenos">539</span></a>                        <span class="nb">min</span><span class="p">(</span><span class="n">row_second</span><span class="p">[</span><span class="s1">&#39;Maximum&#39;</span><span class="p">],</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Maximum&#39;</span><span class="p">]),</span> <span class="mi">2</span><span class="p">,</span>
 </span><span id="L-540"><a href="#L-540"><span class="linenos">540</span></a>                    <span class="p">)</span>
-</span><span id="L-541"><a href="#L-541"><span class="linenos">541</span></a>                    <span class="n">range_spectrum</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span>
-</span><span id="L-542"><a href="#L-542"><span class="linenos">542</span></a>                        <span class="nb">list</span><span class="p">(</span>
-</span><span id="L-543"><a href="#L-543"><span class="linenos">543</span></a>                            <span class="p">{</span>
-</span><span id="L-544"><a href="#L-544"><span class="linenos">544</span></a>                                <span class="mf">0.0</span><span class="p">,</span>
-</span><span id="L-545"><a href="#L-545"><span class="linenos">545</span></a>                                <span class="n">min_bound</span><span class="p">,</span>
-</span><span id="L-546"><a href="#L-546"><span class="linenos">546</span></a>                                <span class="n">n_bound</span> <span class="o">/</span> <span class="mi">10</span><span class="p">,</span>
-</span><span id="L-547"><a href="#L-547"><span class="linenos">547</span></a>                                <span class="n">n_bound</span> <span class="o">/</span> <span class="mi">5</span><span class="p">,</span>
-</span><span id="L-548"><a href="#L-548"><span class="linenos">548</span></a>                                <span class="n">n_bound</span><span class="p">,</span>
-</span><span id="L-549"><a href="#L-549"><span class="linenos">549</span></a>                                <span class="n">max_bound</span><span class="p">,</span>
-</span><span id="L-550"><a href="#L-550"><span class="linenos">550</span></a>                            <span class="p">},</span>
-</span><span id="L-551"><a href="#L-551"><span class="linenos">551</span></a>                        <span class="p">),</span>
-</span><span id="L-552"><a href="#L-552"><span class="linenos">552</span></a>                    <span class="p">)</span>
-</span><span id="L-553"><a href="#L-553"><span class="linenos">553</span></a>
-</span><span id="L-554"><a href="#L-554"><span class="linenos">554</span></a>                    <span class="n">range_spectrum</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">range_spectrum</span> <span class="k">if</span> <span class="n">x</span> <span class="o">&gt;=</span> <span class="mi">0</span><span class="p">]</span>
-</span><span id="L-555"><a href="#L-555"><span class="linenos">555</span></a>                    <span class="n">binner_pair_template</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="L-556"><a href="#L-556"><span class="linenos">556</span></a>                        <span class="s1">&#39;feature&#39;</span><span class="p">:</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">Ratio</span><span class="si">{</span><span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="L-557"><a href="#L-557"><span class="linenos">557</span></a>                        <span class="s1">&#39;src_features&#39;</span><span class="p">:</span> <span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">,</span> <span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span><span class="p">],</span>
-</span><span id="L-558"><a href="#L-558"><span class="linenos">558</span></a>                        <span class="s1">&#39;transformations&#39;</span><span class="p">:</span> <span class="p">[</span><span class="s1">&#39;BinnerLogRatioPlain&#39;</span><span class="p">,</span> <span class="s1">&#39;BinnerLogRatio&#39;</span><span class="p">],</span>
-</span><span id="L-559"><a href="#L-559"><span class="linenos">559</span></a>                        <span class="s1">&#39;n&#39;</span><span class="p">:</span> <span class="n">range_spectrum</span><span class="p">,</span>
-</span><span id="L-560"><a href="#L-560"><span class="linenos">560</span></a>                        <span class="s1">&#39;resolutions&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mf">0.1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">8</span><span class="p">,</span> <span class="mi">16</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">64</span><span class="p">,</span> <span class="mi">128</span><span class="p">],</span>
-</span><span id="L-561"><a href="#L-561"><span class="linenos">561</span></a>                    <span class="p">}</span>
-</span><span id="L-562"><a href="#L-562"><span class="linenos">562</span></a>
-</span><span id="L-563"><a href="#L-563"><span class="linenos">563</span></a>                    <span class="n">binner_pair_template_second</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="L-564"><a href="#L-564"><span class="linenos">564</span></a>                        <span class="s1">&#39;feature&#39;</span><span class="p">:</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">Ratio</span><span class="si">{</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="L-565"><a href="#L-565"><span class="linenos">565</span></a>                        <span class="s1">&#39;src_features&#39;</span><span class="p">:</span> <span class="p">[</span><span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span><span class="p">,</span> <span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">],</span>
-</span><span id="L-566"><a href="#L-566"><span class="linenos">566</span></a>                        <span class="s1">&#39;transformations&#39;</span><span class="p">:</span> <span class="p">[</span><span class="s1">&#39;BinnerLogRatioPlain&#39;</span><span class="p">,</span> <span class="s1">&#39;BinnerLogRatio&#39;</span><span class="p">],</span>
-</span><span id="L-567"><a href="#L-567"><span class="linenos">567</span></a>                        <span class="s1">&#39;n&#39;</span><span class="p">:</span> <span class="n">range_spectrum</span><span class="p">,</span>
-</span><span id="L-568"><a href="#L-568"><span class="linenos">568</span></a>                        <span class="s1">&#39;resolutions&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mf">0.1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">8</span><span class="p">,</span> <span class="mi">16</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">64</span><span class="p">,</span> <span class="mi">128</span><span class="p">],</span>
-</span><span id="L-569"><a href="#L-569"><span class="linenos">569</span></a>                    <span class="p">}</span>
-</span><span id="L-570"><a href="#L-570"><span class="linenos">570</span></a>
-</span><span id="L-571"><a href="#L-571"><span class="linenos">571</span></a>                    <span class="n">transformers_per_feature</span><span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-</span><span id="L-572"><a href="#L-572"><span class="linenos">572</span></a>                        <span class="n">binner_pair_template</span><span class="p">,</span>
-</span><span id="L-573"><a href="#L-573"><span class="linenos">573</span></a>                    <span class="p">)</span>
+</span><span id="L-541"><a href="#L-541"><span class="linenos">541</span></a>                    <span class="n">min_bound</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span>
+</span><span id="L-542"><a href="#L-542"><span class="linenos">542</span></a>                        <span class="n">row_second</span><span class="p">[</span><span class="s1">&#39;Minimum&#39;</span><span class="p">]</span> <span class="o">+</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Minimum&#39;</span><span class="p">],</span> <span class="mi">2</span><span class="p">,</span>
+</span><span id="L-543"><a href="#L-543"><span class="linenos">543</span></a>                    <span class="p">)</span>
+</span><span id="L-544"><a href="#L-544"><span class="linenos">544</span></a>                    <span class="n">range_spectrum</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span>
+</span><span id="L-545"><a href="#L-545"><span class="linenos">545</span></a>                        <span class="nb">list</span><span class="p">(</span>
+</span><span id="L-546"><a href="#L-546"><span class="linenos">546</span></a>                            <span class="p">{</span>
+</span><span id="L-547"><a href="#L-547"><span class="linenos">547</span></a>                                <span class="mf">0.0</span><span class="p">,</span>
+</span><span id="L-548"><a href="#L-548"><span class="linenos">548</span></a>                                <span class="n">min_bound</span><span class="p">,</span>
+</span><span id="L-549"><a href="#L-549"><span class="linenos">549</span></a>                                <span class="n">n_bound</span> <span class="o">/</span> <span class="mi">10</span><span class="p">,</span>
+</span><span id="L-550"><a href="#L-550"><span class="linenos">550</span></a>                                <span class="n">n_bound</span> <span class="o">/</span> <span class="mi">5</span><span class="p">,</span>
+</span><span id="L-551"><a href="#L-551"><span class="linenos">551</span></a>                                <span class="n">n_bound</span><span class="p">,</span>
+</span><span id="L-552"><a href="#L-552"><span class="linenos">552</span></a>                                <span class="n">max_bound</span><span class="p">,</span>
+</span><span id="L-553"><a href="#L-553"><span class="linenos">553</span></a>                            <span class="p">},</span>
+</span><span id="L-554"><a href="#L-554"><span class="linenos">554</span></a>                        <span class="p">),</span>
+</span><span id="L-555"><a href="#L-555"><span class="linenos">555</span></a>                    <span class="p">)</span>
+</span><span id="L-556"><a href="#L-556"><span class="linenos">556</span></a>
+</span><span id="L-557"><a href="#L-557"><span class="linenos">557</span></a>                    <span class="n">range_spectrum</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">range_spectrum</span> <span class="k">if</span> <span class="n">x</span> <span class="o">&gt;=</span> <span class="mi">0</span><span class="p">]</span>
+</span><span id="L-558"><a href="#L-558"><span class="linenos">558</span></a>                    <span class="n">binner_pair_template</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-559"><a href="#L-559"><span class="linenos">559</span></a>                        <span class="s1">&#39;feature&#39;</span><span class="p">:</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">Ratio</span><span class="si">{</span><span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="L-560"><a href="#L-560"><span class="linenos">560</span></a>                        <span class="s1">&#39;src_features&#39;</span><span class="p">:</span> <span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">,</span> <span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span><span class="p">],</span>
+</span><span id="L-561"><a href="#L-561"><span class="linenos">561</span></a>                        <span class="s1">&#39;transformations&#39;</span><span class="p">:</span> <span class="p">[</span><span class="s1">&#39;BinnerLogRatioPlain&#39;</span><span class="p">,</span> <span class="s1">&#39;BinnerLogRatio&#39;</span><span class="p">],</span>
+</span><span id="L-562"><a href="#L-562"><span class="linenos">562</span></a>                        <span class="s1">&#39;n&#39;</span><span class="p">:</span> <span class="n">range_spectrum</span><span class="p">,</span>
+</span><span id="L-563"><a href="#L-563"><span class="linenos">563</span></a>                        <span class="s1">&#39;resolutions&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mf">0.1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">8</span><span class="p">,</span> <span class="mi">16</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">64</span><span class="p">,</span> <span class="mi">128</span><span class="p">],</span>
+</span><span id="L-564"><a href="#L-564"><span class="linenos">564</span></a>                    <span class="p">}</span>
+</span><span id="L-565"><a href="#L-565"><span class="linenos">565</span></a>
+</span><span id="L-566"><a href="#L-566"><span class="linenos">566</span></a>                    <span class="n">binner_pair_template_second</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-567"><a href="#L-567"><span class="linenos">567</span></a>                        <span class="s1">&#39;feature&#39;</span><span class="p">:</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">Ratio</span><span class="si">{</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="L-568"><a href="#L-568"><span class="linenos">568</span></a>                        <span class="s1">&#39;src_features&#39;</span><span class="p">:</span> <span class="p">[</span><span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span><span class="p">,</span> <span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">],</span>
+</span><span id="L-569"><a href="#L-569"><span class="linenos">569</span></a>                        <span class="s1">&#39;transformations&#39;</span><span class="p">:</span> <span class="p">[</span><span class="s1">&#39;BinnerLogRatioPlain&#39;</span><span class="p">,</span> <span class="s1">&#39;BinnerLogRatio&#39;</span><span class="p">],</span>
+</span><span id="L-570"><a href="#L-570"><span class="linenos">570</span></a>                        <span class="s1">&#39;n&#39;</span><span class="p">:</span> <span class="n">range_spectrum</span><span class="p">,</span>
+</span><span id="L-571"><a href="#L-571"><span class="linenos">571</span></a>                        <span class="s1">&#39;resolutions&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mf">0.1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">8</span><span class="p">,</span> <span class="mi">16</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">64</span><span class="p">,</span> <span class="mi">128</span><span class="p">],</span>
+</span><span id="L-572"><a href="#L-572"><span class="linenos">572</span></a>                    <span class="p">}</span>
+</span><span id="L-573"><a href="#L-573"><span class="linenos">573</span></a>
 </span><span id="L-574"><a href="#L-574"><span class="linenos">574</span></a>                    <span class="n">transformers_per_feature</span><span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-</span><span id="L-575"><a href="#L-575"><span class="linenos">575</span></a>                        <span class="n">binner_pair_template_second</span><span class="p">,</span>
+</span><span id="L-575"><a href="#L-575"><span class="linenos">575</span></a>                        <span class="n">binner_pair_template</span><span class="p">,</span>
 </span><span id="L-576"><a href="#L-576"><span class="linenos">576</span></a>                    <span class="p">)</span>
-</span><span id="L-577"><a href="#L-577"><span class="linenos">577</span></a>
-</span><span id="L-578"><a href="#L-578"><span class="linenos">578</span></a>        <span class="n">binner_templates</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-579"><a href="#L-579"><span class="linenos">579</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">transformers_per_feature</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="L-580"><a href="#L-580"><span class="linenos">580</span></a>            <span class="k">for</span> <span class="n">transformer_struct</span> <span class="ow">in</span> <span class="n">v</span><span class="p">:</span>
-</span><span id="L-581"><a href="#L-581"><span class="linenos">581</span></a>                <span class="n">binner_templates</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">transformer_struct</span><span class="p">)</span>
-</span><span id="L-582"><a href="#L-582"><span class="linenos">582</span></a>
-</span><span id="L-583"><a href="#L-583"><span class="linenos">583</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="L-584"><a href="#L-584"><span class="linenos">584</span></a>            <span class="sa">f</span><span class="s1">&#39;Generated </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">binner_templates</span><span class="p">)</span><span class="si">}</span><span class="s1"> transformation search specifications.</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="L-585"><a href="#L-585"><span class="linenos">585</span></a>        <span class="p">)</span>
-</span><span id="L-586"><a href="#L-586"><span class="linenos">586</span></a>        <span class="n">namespace_full</span> <span class="o">=</span> <span class="sa">f</span><span class="s1">&#39;&quot;random_grid_feature_transform&quot;: </span><span class="si">{</span><span class="n">json</span><span class="o">.</span><span class="n">dumps</span><span class="p">(</span><span class="n">binner_templates</span><span class="p">)</span><span class="si">}</span><span class="s1">, &quot;random_grid_epochs&quot;: 512&#39;</span>
-</span><span id="L-587"><a href="#L-587"><span class="linenos">587</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Generated transformations below:</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="L-588"><a href="#L-588"><span class="linenos">588</span></a>        <span class="nb">print</span><span class="p">(</span><span class="n">namespace_full</span><span class="p">)</span>
-</span><span id="L-589"><a href="#L-589"><span class="linenos">589</span></a>
-</span><span id="L-590"><a href="#L-590"><span class="linenos">590</span></a>
-</span><span id="L-591"><a href="#L-591"><span class="linenos">591</span></a><span class="k">def</span> <span class="nf">summarize_rare_counts</span><span class="p">(</span>
-</span><span id="L-592"><a href="#L-592"><span class="linenos">592</span></a>    <span class="n">term_counter</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="L-593"><a href="#L-593"><span class="linenos">593</span></a>    <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="L-594"><a href="#L-594"><span class="linenos">594</span></a>    <span class="n">cardinality_object</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="L-595"><a href="#L-595"><span class="linenos">595</span></a>    <span class="n">object_info</span><span class="p">:</span> <span class="n">DatasetInformationStorage</span><span class="p">,</span>
-</span><span id="L-596"><a href="#L-596"><span class="linenos">596</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-597"><a href="#L-597"><span class="linenos">597</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Write rare values&quot;&quot;&quot;</span>
-</span><span id="L-598"><a href="#L-598"><span class="linenos">598</span></a>
-</span><span id="L-599"><a href="#L-599"><span class="linenos">599</span></a>    <span class="n">out_df_rows</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-600"><a href="#L-600"><span class="linenos">600</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="L-601"><a href="#L-601"><span class="linenos">601</span></a>        <span class="sa">f</span><span class="s1">&#39;Rare value summary (freq &lt;= </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">rare_value_count_upper_bound</span><span class="si">}</span><span class="s1">) follows ..&#39;</span><span class="p">,</span>
-</span><span id="L-602"><a href="#L-602"><span class="linenos">602</span></a>    <span class="p">)</span>
-</span><span id="L-603"><a href="#L-603"><span class="linenos">603</span></a>
-</span><span id="L-604"><a href="#L-604"><span class="linenos">604</span></a>    <span class="k">for</span> <span class="n">namespace_tuple</span><span class="p">,</span> <span class="n">count</span> <span class="ow">in</span> <span class="n">term_counter</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="L-605"><a href="#L-605"><span class="linenos">605</span></a>        <span class="n">namespace</span><span class="p">,</span> <span class="n">value</span> <span class="o">=</span> <span class="n">namespace_tuple</span>
-</span><span id="L-606"><a href="#L-606"><span class="linenos">606</span></a>        <span class="n">out_df_rows</span><span class="o">.</span><span class="n">append</span><span class="p">([</span><span class="n">namespace</span><span class="p">,</span> <span class="n">value</span><span class="p">,</span> <span class="n">count</span><span class="p">])</span>
-</span><span id="L-607"><a href="#L-607"><span class="linenos">607</span></a>    <span class="n">out_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">out_df_rows</span><span class="p">)</span>
-</span><span id="L-608"><a href="#L-608"><span class="linenos">608</span></a>    <span class="n">out_df</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;Namespace&#39;</span><span class="p">,</span> <span class="s1">&#39;value&#39;</span><span class="p">,</span> <span class="s1">&#39;Count&#39;</span><span class="p">]</span>
-</span><span id="L-609"><a href="#L-609"><span class="linenos">609</span></a>    <span class="n">out_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span>
-</span><span id="L-610"><a href="#L-610"><span class="linenos">610</span></a>        <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="p">,</span> <span class="s1">&#39;rare_values.tsv&#39;</span><span class="p">),</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span> <span class="n">index</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-</span><span id="L-611"><a href="#L-611"><span class="linenos">611</span></a>    <span class="p">)</span>
-</span><span id="L-612"><a href="#L-612"><span class="linenos">612</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Wrote rare values to </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="si">}</span><span class="s1">/rare_values.tsv&#39;</span><span class="p">)</span>
-</span><span id="L-613"><a href="#L-613"><span class="linenos">613</span></a>
-</span><span id="L-614"><a href="#L-614"><span class="linenos">614</span></a>    <span class="n">overall_rare_counts</span> <span class="o">=</span> <span class="n">Counter</span><span class="p">(</span><span class="n">out_df</span><span class="o">.</span><span class="n">Namespace</span><span class="o">.</span><span class="n">values</span><span class="p">)</span>
-</span><span id="L-615"><a href="#L-615"><span class="linenos">615</span></a>    <span class="n">sorted_counts</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span>
-</span><span id="L-616"><a href="#L-616"><span class="linenos">616</span></a>        <span class="n">overall_rare_counts</span><span class="o">.</span><span class="n">items</span><span class="p">(),</span> <span class="n">key</span><span class="o">=</span><span class="k">lambda</span> <span class="n">pair</span><span class="p">:</span> <span class="n">pair</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">reverse</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-</span><span id="L-617"><a href="#L-617"><span class="linenos">617</span></a>    <span class="p">)</span>
-</span><span id="L-618"><a href="#L-618"><span class="linenos">618</span></a>    <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">sorted_counts</span><span class="p">:</span>
-</span><span id="L-619"><a href="#L-619"><span class="linenos">619</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Namespace: </span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s1"> ---- Rare values observed: </span><span class="si">{</span><span class="n">v</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="L-620"><a href="#L-620"><span class="linenos">620</span></a>
-</span><span id="L-621"><a href="#L-621"><span class="linenos">621</span></a>    <span class="n">final_df_rows</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-622"><a href="#L-622"><span class="linenos">622</span></a>    <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">sorted_counts</span><span class="p">:</span>
-</span><span id="L-623"><a href="#L-623"><span class="linenos">623</span></a>        <span class="n">cardinality</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">cardinality_object</span><span class="p">[</span><span class="n">k</span><span class="p">])</span>
-</span><span id="L-624"><a href="#L-624"><span class="linenos">624</span></a>        <span class="n">rare_proportion</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">round</span><span class="p">(</span><span class="mi">100</span> <span class="o">*</span> <span class="p">(</span><span class="n">v</span> <span class="o">/</span> <span class="n">cardinality</span><span class="p">),</span> <span class="mi">2</span><span class="p">)</span>
-</span><span id="L-625"><a href="#L-625"><span class="linenos">625</span></a>        <span class="n">col_type</span> <span class="o">=</span> <span class="s1">&#39;nominal&#39;</span>
-</span><span id="L-626"><a href="#L-626"><span class="linenos">626</span></a>        <span class="k">if</span> <span class="n">k</span> <span class="ow">in</span> <span class="n">object_info</span><span class="o">.</span><span class="n">column_types</span><span class="p">:</span>
-</span><span id="L-627"><a href="#L-627"><span class="linenos">627</span></a>            <span class="n">col_type</span> <span class="o">=</span> <span class="s1">&#39;numeric&#39;</span>
-</span><span id="L-628"><a href="#L-628"><span class="linenos">628</span></a>        <span class="n">final_df_rows</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-</span><span id="L-629"><a href="#L-629"><span class="linenos">629</span></a>            <span class="p">{</span>
-</span><span id="L-630"><a href="#L-630"><span class="linenos">630</span></a>                <span class="s1">&#39;rare_proportion&#39;</span><span class="p">:</span> <span class="n">rare_proportion</span><span class="p">,</span>
-</span><span id="L-631"><a href="#L-631"><span class="linenos">631</span></a>                <span class="s1">&#39;feature_type&#39;</span><span class="p">:</span> <span class="n">col_type</span><span class="p">,</span>
-</span><span id="L-632"><a href="#L-632"><span class="linenos">632</span></a>                <span class="s1">&#39;feature_name&#39;</span><span class="p">:</span> <span class="n">k</span><span class="p">,</span>
-</span><span id="L-633"><a href="#L-633"><span class="linenos">633</span></a>            <span class="p">},</span>
-</span><span id="L-634"><a href="#L-634"><span class="linenos">634</span></a>        <span class="p">)</span>
-</span><span id="L-635"><a href="#L-635"><span class="linenos">635</span></a>
-</span><span id="L-636"><a href="#L-636"><span class="linenos">636</span></a>    <span class="n">final_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">final_df_rows</span><span class="p">)</span>
-</span><span id="L-637"><a href="#L-637"><span class="linenos">637</span></a>    <span class="n">final_df</span> <span class="o">=</span> <span class="n">final_df</span><span class="o">.</span><span class="n">sort_values</span><span class="p">(</span><span class="n">by</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;rare_proportion&#39;</span><span class="p">])</span>
-</span><span id="L-638"><a href="#L-638"><span class="linenos">638</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="L-639"><a href="#L-639"><span class="linenos">639</span></a>        <span class="sa">f</span><span class="s1">&#39;Wrote feature sparsity summary to </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="si">}</span><span class="s1">/feature_sparsity_summary.tsv&#39;</span><span class="p">,</span>
-</span><span id="L-640"><a href="#L-640"><span class="linenos">640</span></a>    <span class="p">)</span>
-</span><span id="L-641"><a href="#L-641"><span class="linenos">641</span></a>    <span class="n">final_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span>
-</span><span id="L-642"><a href="#L-642"><span class="linenos">642</span></a>        <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="si">}</span><span class="s1">/feature_sparsity_summary.tsv&#39;</span><span class="p">,</span> <span class="n">index</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="L-577"><a href="#L-577"><span class="linenos">577</span></a>                    <span class="n">transformers_per_feature</span><span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
+</span><span id="L-578"><a href="#L-578"><span class="linenos">578</span></a>                        <span class="n">binner_pair_template_second</span><span class="p">,</span>
+</span><span id="L-579"><a href="#L-579"><span class="linenos">579</span></a>                    <span class="p">)</span>
+</span><span id="L-580"><a href="#L-580"><span class="linenos">580</span></a>
+</span><span id="L-581"><a href="#L-581"><span class="linenos">581</span></a>        <span class="n">binner_templates</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-582"><a href="#L-582"><span class="linenos">582</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">transformers_per_feature</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-583"><a href="#L-583"><span class="linenos">583</span></a>            <span class="k">for</span> <span class="n">transformer_struct</span> <span class="ow">in</span> <span class="n">v</span><span class="p">:</span>
+</span><span id="L-584"><a href="#L-584"><span class="linenos">584</span></a>                <span class="n">binner_templates</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">transformer_struct</span><span class="p">)</span>
+</span><span id="L-585"><a href="#L-585"><span class="linenos">585</span></a>
+</span><span id="L-586"><a href="#L-586"><span class="linenos">586</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="L-587"><a href="#L-587"><span class="linenos">587</span></a>            <span class="sa">f</span><span class="s1">&#39;Generated </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">binner_templates</span><span class="p">)</span><span class="si">}</span><span class="s1"> transformation search specifications.</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="L-588"><a href="#L-588"><span class="linenos">588</span></a>        <span class="p">)</span>
+</span><span id="L-589"><a href="#L-589"><span class="linenos">589</span></a>        <span class="n">namespace_full</span> <span class="o">=</span> <span class="sa">f</span><span class="s1">&#39;&quot;random_grid_feature_transform&quot;: </span><span class="si">{</span><span class="n">json</span><span class="o">.</span><span class="n">dumps</span><span class="p">(</span><span class="n">binner_templates</span><span class="p">)</span><span class="si">}</span><span class="s1">, &quot;random_grid_epochs&quot;: 512&#39;</span>
+</span><span id="L-590"><a href="#L-590"><span class="linenos">590</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Generated transformations below:</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="L-591"><a href="#L-591"><span class="linenos">591</span></a>        <span class="nb">print</span><span class="p">(</span><span class="n">namespace_full</span><span class="p">)</span>
+</span><span id="L-592"><a href="#L-592"><span class="linenos">592</span></a>
+</span><span id="L-593"><a href="#L-593"><span class="linenos">593</span></a>
+</span><span id="L-594"><a href="#L-594"><span class="linenos">594</span></a><span class="k">def</span> <span class="nf">summarize_rare_counts</span><span class="p">(</span>
+</span><span id="L-595"><a href="#L-595"><span class="linenos">595</span></a>    <span class="n">term_counter</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="L-596"><a href="#L-596"><span class="linenos">596</span></a>    <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="L-597"><a href="#L-597"><span class="linenos">597</span></a>    <span class="n">cardinality_object</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="L-598"><a href="#L-598"><span class="linenos">598</span></a>    <span class="n">object_info</span><span class="p">:</span> <span class="n">DatasetInformationStorage</span><span class="p">,</span>
+</span><span id="L-599"><a href="#L-599"><span class="linenos">599</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-600"><a href="#L-600"><span class="linenos">600</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Write rare values&quot;&quot;&quot;</span>
+</span><span id="L-601"><a href="#L-601"><span class="linenos">601</span></a>
+</span><span id="L-602"><a href="#L-602"><span class="linenos">602</span></a>    <span class="n">out_df_rows</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-603"><a href="#L-603"><span class="linenos">603</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="L-604"><a href="#L-604"><span class="linenos">604</span></a>        <span class="sa">f</span><span class="s1">&#39;Rare value summary (freq &lt;= </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">rare_value_count_upper_bound</span><span class="si">}</span><span class="s1">) follows ..&#39;</span><span class="p">,</span>
+</span><span id="L-605"><a href="#L-605"><span class="linenos">605</span></a>    <span class="p">)</span>
+</span><span id="L-606"><a href="#L-606"><span class="linenos">606</span></a>
+</span><span id="L-607"><a href="#L-607"><span class="linenos">607</span></a>    <span class="k">for</span> <span class="n">namespace_tuple</span><span class="p">,</span> <span class="n">count</span> <span class="ow">in</span> <span class="n">term_counter</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-608"><a href="#L-608"><span class="linenos">608</span></a>        <span class="n">namespace</span><span class="p">,</span> <span class="n">value</span> <span class="o">=</span> <span class="n">namespace_tuple</span>
+</span><span id="L-609"><a href="#L-609"><span class="linenos">609</span></a>        <span class="n">out_df_rows</span><span class="o">.</span><span class="n">append</span><span class="p">([</span><span class="n">namespace</span><span class="p">,</span> <span class="n">value</span><span class="p">,</span> <span class="n">count</span><span class="p">])</span>
+</span><span id="L-610"><a href="#L-610"><span class="linenos">610</span></a>    <span class="n">out_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">out_df_rows</span><span class="p">)</span>
+</span><span id="L-611"><a href="#L-611"><span class="linenos">611</span></a>    <span class="n">out_df</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;Namespace&#39;</span><span class="p">,</span> <span class="s1">&#39;value&#39;</span><span class="p">,</span> <span class="s1">&#39;Count&#39;</span><span class="p">]</span>
+</span><span id="L-612"><a href="#L-612"><span class="linenos">612</span></a>    <span class="n">out_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span>
+</span><span id="L-613"><a href="#L-613"><span class="linenos">613</span></a>        <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="p">,</span> <span class="s1">&#39;rare_values.tsv&#39;</span><span class="p">),</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span> <span class="n">index</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+</span><span id="L-614"><a href="#L-614"><span class="linenos">614</span></a>    <span class="p">)</span>
+</span><span id="L-615"><a href="#L-615"><span class="linenos">615</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Wrote rare values to </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="si">}</span><span class="s1">/rare_values.tsv&#39;</span><span class="p">)</span>
+</span><span id="L-616"><a href="#L-616"><span class="linenos">616</span></a>
+</span><span id="L-617"><a href="#L-617"><span class="linenos">617</span></a>    <span class="n">overall_rare_counts</span> <span class="o">=</span> <span class="n">Counter</span><span class="p">(</span><span class="n">out_df</span><span class="o">.</span><span class="n">Namespace</span><span class="o">.</span><span class="n">values</span><span class="p">)</span>
+</span><span id="L-618"><a href="#L-618"><span class="linenos">618</span></a>    <span class="n">sorted_counts</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span>
+</span><span id="L-619"><a href="#L-619"><span class="linenos">619</span></a>        <span class="n">overall_rare_counts</span><span class="o">.</span><span class="n">items</span><span class="p">(),</span> <span class="n">key</span><span class="o">=</span><span class="k">lambda</span> <span class="n">pair</span><span class="p">:</span> <span class="n">pair</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">reverse</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+</span><span id="L-620"><a href="#L-620"><span class="linenos">620</span></a>    <span class="p">)</span>
+</span><span id="L-621"><a href="#L-621"><span class="linenos">621</span></a>    <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">sorted_counts</span><span class="p">:</span>
+</span><span id="L-622"><a href="#L-622"><span class="linenos">622</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Namespace: </span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s1"> ---- Rare values observed: </span><span class="si">{</span><span class="n">v</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="L-623"><a href="#L-623"><span class="linenos">623</span></a>
+</span><span id="L-624"><a href="#L-624"><span class="linenos">624</span></a>    <span class="n">final_df_rows</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-625"><a href="#L-625"><span class="linenos">625</span></a>    <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">sorted_counts</span><span class="p">:</span>
+</span><span id="L-626"><a href="#L-626"><span class="linenos">626</span></a>        <span class="n">cardinality</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">cardinality_object</span><span class="p">[</span><span class="n">k</span><span class="p">])</span>
+</span><span id="L-627"><a href="#L-627"><span class="linenos">627</span></a>        <span class="n">rare_proportion</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">round</span><span class="p">(</span><span class="mi">100</span> <span class="o">*</span> <span class="p">(</span><span class="n">v</span> <span class="o">/</span> <span class="n">cardinality</span><span class="p">),</span> <span class="mi">2</span><span class="p">)</span>
+</span><span id="L-628"><a href="#L-628"><span class="linenos">628</span></a>        <span class="n">col_type</span> <span class="o">=</span> <span class="s1">&#39;nominal&#39;</span>
+</span><span id="L-629"><a href="#L-629"><span class="linenos">629</span></a>        <span class="k">if</span> <span class="n">k</span> <span class="ow">in</span> <span class="n">object_info</span><span class="o">.</span><span class="n">column_types</span><span class="p">:</span>
+</span><span id="L-630"><a href="#L-630"><span class="linenos">630</span></a>            <span class="n">col_type</span> <span class="o">=</span> <span class="s1">&#39;numeric&#39;</span>
+</span><span id="L-631"><a href="#L-631"><span class="linenos">631</span></a>        <span class="n">final_df_rows</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
+</span><span id="L-632"><a href="#L-632"><span class="linenos">632</span></a>            <span class="p">{</span>
+</span><span id="L-633"><a href="#L-633"><span class="linenos">633</span></a>                <span class="s1">&#39;rare_proportion&#39;</span><span class="p">:</span> <span class="n">rare_proportion</span><span class="p">,</span>
+</span><span id="L-634"><a href="#L-634"><span class="linenos">634</span></a>                <span class="s1">&#39;feature_type&#39;</span><span class="p">:</span> <span class="n">col_type</span><span class="p">,</span>
+</span><span id="L-635"><a href="#L-635"><span class="linenos">635</span></a>                <span class="s1">&#39;feature_name&#39;</span><span class="p">:</span> <span class="n">k</span><span class="p">,</span>
+</span><span id="L-636"><a href="#L-636"><span class="linenos">636</span></a>            <span class="p">},</span>
+</span><span id="L-637"><a href="#L-637"><span class="linenos">637</span></a>        <span class="p">)</span>
+</span><span id="L-638"><a href="#L-638"><span class="linenos">638</span></a>
+</span><span id="L-639"><a href="#L-639"><span class="linenos">639</span></a>    <span class="n">final_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">final_df_rows</span><span class="p">)</span>
+</span><span id="L-640"><a href="#L-640"><span class="linenos">640</span></a>    <span class="n">final_df</span> <span class="o">=</span> <span class="n">final_df</span><span class="o">.</span><span class="n">sort_values</span><span class="p">(</span><span class="n">by</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;rare_proportion&#39;</span><span class="p">])</span>
+</span><span id="L-641"><a href="#L-641"><span class="linenos">641</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="L-642"><a href="#L-642"><span class="linenos">642</span></a>        <span class="sa">f</span><span class="s1">&#39;Wrote feature sparsity summary to </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="si">}</span><span class="s1">/feature_sparsity_summary.tsv&#39;</span><span class="p">,</span>
 </span><span id="L-643"><a href="#L-643"><span class="linenos">643</span></a>    <span class="p">)</span>
+</span><span id="L-644"><a href="#L-644"><span class="linenos">644</span></a>    <span class="n">final_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span>
+</span><span id="L-645"><a href="#L-645"><span class="linenos">645</span></a>        <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="si">}</span><span class="s1">/feature_sparsity_summary.tsv&#39;</span><span class="p">,</span> <span class="n">index</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="L-646"><a href="#L-646"><span class="linenos">646</span></a>    <span class="p">)</span>
+</span><span id="L-647"><a href="#L-647"><span class="linenos">647</span></a>
+</span><span id="L-648"><a href="#L-648"><span class="linenos">648</span></a>
+</span><span id="L-649"><a href="#L-649"><span class="linenos">649</span></a><span class="k">def</span> <span class="nf">is_prior_heuristic</span><span class="p">(</span><span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">bool</span><span class="p">:</span>
+</span><span id="L-650"><a href="#L-650"><span class="linenos">650</span></a>    <span class="k">if</span> <span class="s1">&#39;-prior&#39;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span><span class="p">:</span>
+</span><span id="L-651"><a href="#L-651"><span class="linenos">651</span></a>        <span class="k">return</span> <span class="kc">True</span>
+</span><span id="L-652"><a href="#L-652"><span class="linenos">652</span></a>    <span class="k">return</span> <span class="kc">False</span>
+</span><span id="L-653"><a href="#L-653"><span class="linenos">653</span></a>
+</span><span id="L-654"><a href="#L-654"><span class="linenos">654</span></a>
+</span><span id="L-655"><a href="#L-655"><span class="linenos">655</span></a><span class="k">def</span> <span class="nf">get_num_of_instances</span><span class="p">(</span><span class="n">fname</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="L-656"><a href="#L-656"><span class="linenos">656</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Count the number of lines in a file, fast - useful for progress logging&quot;&quot;&quot;</span>
+</span><span id="L-657"><a href="#L-657"><span class="linenos">657</span></a>
+</span><span id="L-658"><a href="#L-658"><span class="linenos">658</span></a>    <span class="k">def</span> <span class="nf">_make_gen</span><span class="p">(</span><span class="n">reader</span><span class="p">):</span>
+</span><span id="L-659"><a href="#L-659"><span class="linenos">659</span></a>        <span class="k">while</span> <span class="kc">True</span><span class="p">:</span>
+</span><span id="L-660"><a href="#L-660"><span class="linenos">660</span></a>            <span class="n">b</span> <span class="o">=</span> <span class="n">reader</span><span class="p">(</span><span class="mi">2</span><span class="o">**</span><span class="mi">16</span><span class="p">)</span>
+</span><span id="L-661"><a href="#L-661"><span class="linenos">661</span></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">b</span><span class="p">:</span>
+</span><span id="L-662"><a href="#L-662"><span class="linenos">662</span></a>                <span class="k">break</span>
+</span><span id="L-663"><a href="#L-663"><span class="linenos">663</span></a>            <span class="k">yield</span> <span class="n">b</span>
+</span><span id="L-664"><a href="#L-664"><span class="linenos">664</span></a>
+</span><span id="L-665"><a href="#L-665"><span class="linenos">665</span></a>    <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">fname</span><span class="p">,</span> <span class="s1">&#39;rb&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
+</span><span id="L-666"><a href="#L-666"><span class="linenos">666</span></a>        <span class="n">count</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">(</span><span class="n">buf</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="sa">b</span><span class="s1">&#39;</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">)</span> <span class="k">for</span> <span class="n">buf</span> <span class="ow">in</span> <span class="n">_make_gen</span><span class="p">(</span><span class="n">f</span><span class="o">.</span><span class="n">raw</span><span class="o">.</span><span class="n">read</span><span class="p">))</span>
+</span><span id="L-667"><a href="#L-667"><span class="linenos">667</span></a>    <span class="k">return</span> <span class="n">count</span>
 </span></pre></div>
 
 
@@ -848,17 +878,17 @@ <h1 class="modulename">
 <input id="pro_tips-view-value" class="view-value-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
             <label class="view-value-button pdoc-button" for="pro_tips-view-value"></label><span class="default_value">[&#39;OutRank can construct subfeatures; features based on subspaces. Example command argument is: --subfeature_mapping &#34;feature_a-&gt;feature_b;feature_c&lt;-&gt;feature_d;feature_c&lt;-&gt;feature_e&#34;&#39;, &#39;Heuristic MI-numba-randomized seems like the best of both worlds! (speed + performance).&#39;, &#39;Heuristic surrogate-lr performs cross-validation (internally), keep that in mind!&#39;, &#39;Consider running OutRank on a smaller data sample first, might be enough (--subsampling = a lot).&#39;, &#39;There are two types of combinations supported; unsupervised pairwise ranking (redundancies- --target_ranking_only=False), and supervised combinations - (--interaction_order &gt; 1)&#39;, &#39;Visualization part also includes clustering - this might be very insightful!&#39;, &#39;By default OutRank includes feature cardinality and coverage in feature names (card; cov)&#39;, &#39;Intermediary checkpoints (tmp_checkpoint.tsv) might already give you insights during longer runs.&#39;, &#39;In theory, you can rank redundancies of combined features (--interaction_order AND --target_ranking_only=False).&#39;, &#39;Give it as many threads as physically possible (--num_threads).&#39;, &#39;You can speed up ranking by diminishing feature buffer size (--combination_number_upper_bound determines how many ranking computations per batch will be considered). This, and --subsampling are very powerful together.&#39;, &#39;Want to rank feature transformations, but not sure which ones to choose? --transformers=default should serve as a solid baseline (common DS transformations included).&#39;, &#39;Your target can be any feature! (explaining one feature with others)&#39;, &#39;OutRank uses HyperLogLog for cardinality estimation - this is also a potential usecase (understanding cardinalities across different data sets).&#39;, &#39;Each feature is named as featureName(cardinality, coverage in percents) in the final files.&#39;, &#39;You can generate candidate feature transformation ranges (fw) by using --task=feature_summary_transformers.&#39;]</span>
 
-
+        
     </div>
     <a class="headerlink" href="#pro_tips"></a>
-
-
+    
+    
 
                 </section>
                 <section id="write_json_dump_to_file">
                             <input id="write_json_dump_to_file-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">write_json_dump_to_file</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">args</span><span class="p">:</span> <span class="n">Any</span>, </span><span class="param"><span class="n">config_name</span><span class="p">:</span> <span class="nb">str</span></span><span class="return-annotation">) -> <span class="kc">None</span>:</span></span>
 
@@ -874,13 +904,13 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                 </section>
                 <section id="internal_hash">
                             <input id="internal_hash-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">internal_hash</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">input_obj</span><span class="p">:</span> <span class="nb">str</span></span><span class="return-annotation">) -> <span class="nb">str</span>:</span></span>
 
@@ -930,80 +960,80 @@ <h1 class="modulename">
 
                             <div id="DatasetInformationStorage.__init__" class="classattr">
                                 <div class="attr function">
-
+            
         <span class="name">DatasetInformationStorage</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">data_path</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">column_names</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span>,</span><span class="param">	<span class="n">column_types</span><span class="p">:</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span>,</span><span class="param">	<span class="n">col_delimiter</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">encoding</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">fw_map</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">]</span> <span class="o">|</span> <span class="kc">None</span></span>)</span>
 
-
+        
     </div>
     <a class="headerlink" href="#DatasetInformationStorage.__init__"></a>
-
-
+    
+    
 
                             </div>
                             <div id="DatasetInformationStorage.data_path" class="classattr">
                                 <div class="attr variable">
             <span class="name">data_path</span><span class="annotation">: str</span>
 
-
+        
     </div>
     <a class="headerlink" href="#DatasetInformationStorage.data_path"></a>
-
-
+    
+    
 
                             </div>
                             <div id="DatasetInformationStorage.column_names" class="classattr">
                                 <div class="attr variable">
             <span class="name">column_names</span><span class="annotation">: list[str]</span>
 
-
+        
     </div>
     <a class="headerlink" href="#DatasetInformationStorage.column_names"></a>
-
-
+    
+    
 
                             </div>
                             <div id="DatasetInformationStorage.column_types" class="classattr">
                                 <div class="attr variable">
             <span class="name">column_types</span><span class="annotation">: set[str]</span>
 
-
+        
     </div>
     <a class="headerlink" href="#DatasetInformationStorage.column_types"></a>
-
-
+    
+    
 
                             </div>
                             <div id="DatasetInformationStorage.col_delimiter" class="classattr">
                                 <div class="attr variable">
             <span class="name">col_delimiter</span><span class="annotation">: str | None</span>
 
-
+        
     </div>
     <a class="headerlink" href="#DatasetInformationStorage.col_delimiter"></a>
-
-
+    
+    
 
                             </div>
                             <div id="DatasetInformationStorage.encoding" class="classattr">
                                 <div class="attr variable">
             <span class="name">encoding</span><span class="annotation">: str</span>
 
-
+        
     </div>
     <a class="headerlink" href="#DatasetInformationStorage.encoding"></a>
-
-
+    
+    
 
                             </div>
                             <div id="DatasetInformationStorage.fw_map" class="classattr">
                                 <div class="attr variable">
             <span class="name">fw_map</span><span class="annotation">: dict[str, str] | None</span>
 
-
+        
     </div>
     <a class="headerlink" href="#DatasetInformationStorage.fw_map"></a>
-
-
+    
+    
 
                             </div>
                 </section>
@@ -1037,69 +1067,69 @@ <h1 class="modulename">
 
                             <div id="NumericFeatureSummary.__init__" class="classattr">
                                 <div class="attr function">
-
+            
         <span class="name">NumericFeatureSummary</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">feature_name</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">minimum</span><span class="p">:</span> <span class="nb">float</span>,</span><span class="param">	<span class="n">maximum</span><span class="p">:</span> <span class="nb">float</span>,</span><span class="param">	<span class="n">median</span><span class="p">:</span> <span class="nb">float</span>,</span><span class="param">	<span class="n">num_unique</span><span class="p">:</span> <span class="nb">int</span></span>)</span>
 
-
+        
     </div>
     <a class="headerlink" href="#NumericFeatureSummary.__init__"></a>
-
-
+    
+    
 
                             </div>
                             <div id="NumericFeatureSummary.feature_name" class="classattr">
                                 <div class="attr variable">
             <span class="name">feature_name</span><span class="annotation">: str</span>
 
-
+        
     </div>
     <a class="headerlink" href="#NumericFeatureSummary.feature_name"></a>
-
-
+    
+    
 
                             </div>
                             <div id="NumericFeatureSummary.minimum" class="classattr">
                                 <div class="attr variable">
             <span class="name">minimum</span><span class="annotation">: float</span>
 
-
+        
     </div>
     <a class="headerlink" href="#NumericFeatureSummary.minimum"></a>
-
-
+    
+    
 
                             </div>
                             <div id="NumericFeatureSummary.maximum" class="classattr">
                                 <div class="attr variable">
             <span class="name">maximum</span><span class="annotation">: float</span>
 
-
+        
     </div>
     <a class="headerlink" href="#NumericFeatureSummary.maximum"></a>
-
-
+    
+    
 
                             </div>
                             <div id="NumericFeatureSummary.median" class="classattr">
                                 <div class="attr variable">
             <span class="name">median</span><span class="annotation">: float</span>
 
-
+        
     </div>
     <a class="headerlink" href="#NumericFeatureSummary.median"></a>
-
-
+    
+    
 
                             </div>
                             <div id="NumericFeatureSummary.num_unique" class="classattr">
                                 <div class="attr variable">
             <span class="name">num_unique</span><span class="annotation">: int</span>
 
-
+        
     </div>
     <a class="headerlink" href="#NumericFeatureSummary.num_unique"></a>
-
-
+    
+    
 
                             </div>
                 </section>
@@ -1130,36 +1160,36 @@ <h1 class="modulename">
 
                             <div id="NominalFeatureSummary.__init__" class="classattr">
                                 <div class="attr function">
-
+            
         <span class="name">NominalFeatureSummary</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">feature_name</span><span class="p">:</span> <span class="nb">str</span>, </span><span class="param"><span class="n">num_unique</span><span class="p">:</span> <span class="nb">int</span></span>)</span>
 
-
+        
     </div>
     <a class="headerlink" href="#NominalFeatureSummary.__init__"></a>
-
-
+    
+    
 
                             </div>
                             <div id="NominalFeatureSummary.feature_name" class="classattr">
                                 <div class="attr variable">
             <span class="name">feature_name</span><span class="annotation">: str</span>
 
-
+        
     </div>
     <a class="headerlink" href="#NominalFeatureSummary.feature_name"></a>
-
-
+    
+    
 
                             </div>
                             <div id="NominalFeatureSummary.num_unique" class="classattr">
                                 <div class="attr variable">
             <span class="name">num_unique</span><span class="annotation">: int</span>
 
-
+        
     </div>
     <a class="headerlink" href="#NominalFeatureSummary.num_unique"></a>
-
-
+    
+    
 
                             </div>
                 </section>
@@ -1190,43 +1220,43 @@ <h1 class="modulename">
 
                             <div id="BatchRankingSummary.__init__" class="classattr">
                                 <div class="attr function">
-
+            
         <span class="name">BatchRankingSummary</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">triplet_scores</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">]]</span>,</span><span class="param">	<span class="n">step_times</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">]</span></span>)</span>
 
-
+        
     </div>
     <a class="headerlink" href="#BatchRankingSummary.__init__"></a>
-
-
+    
+    
 
                             </div>
                             <div id="BatchRankingSummary.triplet_scores" class="classattr">
                                 <div class="attr variable">
             <span class="name">triplet_scores</span><span class="annotation">: list[tuple[str, str, float]]</span>
 
-
+        
     </div>
     <a class="headerlink" href="#BatchRankingSummary.triplet_scores"></a>
-
-
+    
+    
 
                             </div>
                             <div id="BatchRankingSummary.step_times" class="classattr">
                                 <div class="attr variable">
             <span class="name">step_times</span><span class="annotation">: dict[str, typing.Any]</span>
 
-
+        
     </div>
     <a class="headerlink" href="#BatchRankingSummary.step_times"></a>
-
-
+    
+    
 
                             </div>
                 </section>
                 <section id="display_random_tip">
                             <input id="display_random_tip-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">display_random_tip</span><span class="signature pdoc-code condensed">(<span class="return-annotation">) -> <span class="kc">None</span>:</span></span>
 
@@ -1246,13 +1276,13 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                 </section>
                 <section id="get_dataset_info">
                             <input id="get_dataset_info-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">get_dataset_info</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">args</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">):</span></span>
 
@@ -1281,13 +1311,13 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                 </section>
                 <section id="display_tool_name">
                             <input id="display_tool_name-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">display_tool_name</span><span class="signature pdoc-code condensed">(<span class="return-annotation">) -> <span class="kc">None</span>:</span></span>
 
@@ -1326,13 +1356,13 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                 </section>
                 <section id="parse_ob_line">
                             <input id="parse_ob_line-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">parse_ob_line</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">line_string</span><span class="p">:</span> <span class="nb">str</span>, </span><span class="param"><span class="n">delimiter</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span>, </span><span class="param"><span class="n">args</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span></span><span class="return-annotation">) -> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span>:</span></span>
 
@@ -1359,7 +1389,7 @@ <h1 class="modulename">
                 <section id="parse_ob_line_vw">
                             <input id="parse_ob_line_vw-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">parse_ob_line_vw</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">line_string</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">delimiter</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">args</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">fw_col_mapping</span><span class="o">=</span><span class="kc">None</span>,</span><span class="param">	<span class="n">table_header</span><span class="o">=</span><span class="kc">None</span>,</span><span class="param">	<span class="n">include_namespace_info</span><span class="o">=</span><span class="kc">False</span></span><span class="return-annotation">) -> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span> <span class="o">|</span> <span class="kc">None</span><span class="p">]</span>:</span></span>
 
@@ -1419,7 +1449,7 @@ <h1 class="modulename">
                 <section id="parse_ob_csv_line">
                             <input id="parse_ob_csv_line-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">parse_ob_csv_line</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">line_string</span><span class="p">:</span> <span class="nb">str</span>, </span><span class="param"><span class="n">delimiter</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;,&#39;</span>, </span><span class="param"><span class="n">args</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span></span><span class="return-annotation">) -> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span>:</span></span>
 
@@ -1445,7 +1475,7 @@ <h1 class="modulename">
                 <section id="generic_line_parser">
                             <input id="generic_line_parser-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">generic_line_parser</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">line_string</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">delimiter</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">args</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">fw_col_mapping</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">table_header</span><span class="p">:</span> <span class="n">Any</span> <span class="o">=</span> <span class="kc">None</span></span><span class="return-annotation">) -> <span class="nb">list</span><span class="p">[</span><span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">]</span>:</span></span>
 
@@ -1488,7 +1518,7 @@ <h1 class="modulename">
                 <section id="read_reference_json">
                             <input id="read_reference_json-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">read_reference_json</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">json_path</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">dict</span><span class="p">]</span>:</span></span>
 
@@ -1511,7 +1541,7 @@ <h1 class="modulename">
                 <section id="parse_namespace">
                             <input id="parse_namespace-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">parse_namespace</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">namespace_path</span><span class="p">:</span> <span class="nb">str</span></span><span class="return-annotation">) -> <span class="nb">tuple</span><span class="p">[</span><span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">]]</span>:</span></span>
 
@@ -1554,7 +1584,7 @@ <h1 class="modulename">
                 <section id="read_column_names">
                             <input id="read_column_names-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">read_column_names</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">mapping_file</span><span class="p">:</span> <span class="nb">str</span></span><span class="return-annotation">) -> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span>:</span></span>
 
@@ -1579,7 +1609,7 @@ <h1 class="modulename">
                 <section id="parse_ob_vw_feature_information">
                             <input id="parse_ob_vw_feature_information-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">parse_ob_vw_feature_information</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">data_path</span></span><span class="return-annotation">) -> <span class="n"><a href="#DatasetInformationStorage">DatasetInformationStorage</a></span>:</span></span>
 
@@ -1615,7 +1645,7 @@ <h1 class="modulename">
                 <section id="parse_ob_raw_feature_information">
                             <input id="parse_ob_raw_feature_information-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">parse_ob_raw_feature_information</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">data_path</span></span><span class="return-annotation">) -> <span class="n"><a href="#DatasetInformationStorage">DatasetInformationStorage</a></span>:</span></span>
 
@@ -1670,7 +1700,7 @@ <h1 class="modulename">
                 <section id="parse_ob_feature_information">
                             <input id="parse_ob_feature_information-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">parse_ob_feature_information</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">data_path</span></span><span class="return-annotation">) -> <span class="n"><a href="#DatasetInformationStorage">DatasetInformationStorage</a></span>:</span></span>
 
@@ -1707,7 +1737,7 @@ <h1 class="modulename">
                 <section id="parse_csv_with_description_information">
                             <input id="parse_csv_with_description_information-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">parse_csv_with_description_information</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">data_path</span></span><span class="return-annotation">) -> <span class="n"><a href="#DatasetInformationStorage">DatasetInformationStorage</a></span>:</span></span>
 
@@ -1736,13 +1766,13 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                 </section>
                 <section id="parse_csv_raw">
                             <input id="parse_csv_raw-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">parse_csv_raw</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">data_path</span></span><span class="return-annotation">) -> <span class="n"><a href="#DatasetInformationStorage">DatasetInformationStorage</a></span>:</span></span>
 
@@ -1765,21 +1795,21 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                 </section>
                 <section id="extract_features_from_reference_JSON">
                             <input id="extract_features_from_reference_JSON-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
-        <span class="name">extract_features_from_reference_JSON</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">json_path</span><span class="p">:</span> <span class="nb">str</span>, </span><span class="param"><span class="n">combined_features_only</span><span class="o">=</span><span class="kc">False</span></span><span class="return-annotation">) -> <span class="nb">set</span><span class="p">[</span><span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">]</span>:</span></span>
+        <span class="name">extract_features_from_reference_JSON</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">json_path</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">combined_features_only</span><span class="o">=</span><span class="kc">False</span>,</span><span class="param">	<span class="n">all_features</span><span class="o">=</span><span class="kc">False</span></span><span class="return-annotation">) -> <span class="nb">set</span><span class="p">[</span><span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">]</span>:</span></span>
 
                 <label class="view-source-button" for="extract_features_from_reference_JSON-view-source"><span>View Source</span></label>
 
     </div>
     <a class="headerlink" href="#extract_features_from_reference_JSON"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="extract_features_from_reference_JSON-397"><a href="#extract_features_from_reference_JSON-397"><span class="linenos">397</span></a><span class="k">def</span> <span class="nf">extract_features_from_reference_JSON</span><span class="p">(</span><span class="n">json_path</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">combined_features_only</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">set</span><span class="p">[</span><span class="n">Any</span><span class="p">]:</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="extract_features_from_reference_JSON-397"><a href="#extract_features_from_reference_JSON-397"><span class="linenos">397</span></a><span class="k">def</span> <span class="nf">extract_features_from_reference_JSON</span><span class="p">(</span><span class="n">json_path</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">combined_features_only</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span> <span class="n">all_features</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">set</span><span class="p">[</span><span class="n">Any</span><span class="p">]:</span>
 </span><span id="extract_features_from_reference_JSON-398"><a href="#extract_features_from_reference_JSON-398"><span class="linenos">398</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Given a model&#39;s JSON, extract unique features&quot;&quot;&quot;</span>
 </span><span id="extract_features_from_reference_JSON-399"><a href="#extract_features_from_reference_JSON-399"><span class="linenos">399</span></a>
 </span><span id="extract_features_from_reference_JSON-400"><a href="#extract_features_from_reference_JSON-400"><span class="linenos">400</span></a>    <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">json_path</span><span class="p">)</span> <span class="k">as</span> <span class="n">jp</span><span class="p">:</span>
@@ -1787,17 +1817,20 @@ <h1 class="modulename">
 </span><span id="extract_features_from_reference_JSON-402"><a href="#extract_features_from_reference_JSON-402"><span class="linenos">402</span></a>
 </span><span id="extract_features_from_reference_JSON-403"><a href="#extract_features_from_reference_JSON-403"><span class="linenos">403</span></a>    <span class="n">unique_features</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span>
 </span><span id="extract_features_from_reference_JSON-404"><a href="#extract_features_from_reference_JSON-404"><span class="linenos">404</span></a>    <span class="n">feature_space</span> <span class="o">=</span> <span class="n">content</span><span class="p">[</span><span class="s1">&#39;desc&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;features&#39;</span><span class="p">,</span> <span class="p">[])</span>
-</span><span id="extract_features_from_reference_JSON-405"><a href="#extract_features_from_reference_JSON-405"><span class="linenos">405</span></a>    <span class="n">fields_space</span> <span class="o">=</span> <span class="n">content</span><span class="p">[</span><span class="s1">&#39;desc&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;fields&#39;</span><span class="p">,</span> <span class="p">[])</span>
-</span><span id="extract_features_from_reference_JSON-406"><a href="#extract_features_from_reference_JSON-406"><span class="linenos">406</span></a>    <span class="n">joint_space</span> <span class="o">=</span> <span class="n">feature_space</span> <span class="o">+</span> <span class="n">fields_space</span>
+</span><span id="extract_features_from_reference_JSON-405"><a href="#extract_features_from_reference_JSON-405"><span class="linenos">405</span></a>    <span class="k">if</span> <span class="n">all_features</span><span class="p">:</span>
+</span><span id="extract_features_from_reference_JSON-406"><a href="#extract_features_from_reference_JSON-406"><span class="linenos">406</span></a>        <span class="k">return</span> <span class="nb">set</span><span class="p">(</span><span class="n">feature_space</span><span class="p">)</span>
 </span><span id="extract_features_from_reference_JSON-407"><a href="#extract_features_from_reference_JSON-407"><span class="linenos">407</span></a>
-</span><span id="extract_features_from_reference_JSON-408"><a href="#extract_features_from_reference_JSON-408"><span class="linenos">408</span></a>    <span class="k">if</span> <span class="n">combined_features_only</span><span class="p">:</span>
-</span><span id="extract_features_from_reference_JSON-409"><a href="#extract_features_from_reference_JSON-409"><span class="linenos">409</span></a>        <span class="k">return</span> <span class="p">{</span><span class="n">feature</span> <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">feature_space</span> <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))</span><span class="o">&gt;</span><span class="mi">1</span><span class="p">}</span>
+</span><span id="extract_features_from_reference_JSON-408"><a href="#extract_features_from_reference_JSON-408"><span class="linenos">408</span></a>    <span class="n">fields_space</span> <span class="o">=</span> <span class="n">content</span><span class="p">[</span><span class="s1">&#39;desc&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;fields&#39;</span><span class="p">,</span> <span class="p">[])</span>
+</span><span id="extract_features_from_reference_JSON-409"><a href="#extract_features_from_reference_JSON-409"><span class="linenos">409</span></a>    <span class="n">joint_space</span> <span class="o">=</span> <span class="n">feature_space</span> <span class="o">+</span> <span class="n">fields_space</span>
 </span><span id="extract_features_from_reference_JSON-410"><a href="#extract_features_from_reference_JSON-410"><span class="linenos">410</span></a>
-</span><span id="extract_features_from_reference_JSON-411"><a href="#extract_features_from_reference_JSON-411"><span class="linenos">411</span></a>    <span class="k">for</span> <span class="n">feature_tuple</span> <span class="ow">in</span> <span class="n">joint_space</span><span class="p">:</span>
-</span><span id="extract_features_from_reference_JSON-412"><a href="#extract_features_from_reference_JSON-412"><span class="linenos">412</span></a>        <span class="k">for</span> <span class="n">individual_feature</span> <span class="ow">in</span> <span class="n">feature_tuple</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">):</span>
-</span><span id="extract_features_from_reference_JSON-413"><a href="#extract_features_from_reference_JSON-413"><span class="linenos">413</span></a>            <span class="n">unique_features</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">individual_feature</span><span class="p">)</span>
-</span><span id="extract_features_from_reference_JSON-414"><a href="#extract_features_from_reference_JSON-414"><span class="linenos">414</span></a>
-</span><span id="extract_features_from_reference_JSON-415"><a href="#extract_features_from_reference_JSON-415"><span class="linenos">415</span></a>    <span class="k">return</span> <span class="n">unique_features</span>
+</span><span id="extract_features_from_reference_JSON-411"><a href="#extract_features_from_reference_JSON-411"><span class="linenos">411</span></a>    <span class="k">if</span> <span class="n">combined_features_only</span><span class="p">:</span>
+</span><span id="extract_features_from_reference_JSON-412"><a href="#extract_features_from_reference_JSON-412"><span class="linenos">412</span></a>        <span class="k">return</span> <span class="p">{</span><span class="n">feature</span> <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">feature_space</span> <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">))</span><span class="o">&gt;</span><span class="mi">1</span><span class="p">}</span>
+</span><span id="extract_features_from_reference_JSON-413"><a href="#extract_features_from_reference_JSON-413"><span class="linenos">413</span></a>
+</span><span id="extract_features_from_reference_JSON-414"><a href="#extract_features_from_reference_JSON-414"><span class="linenos">414</span></a>    <span class="k">for</span> <span class="n">feature_tuple</span> <span class="ow">in</span> <span class="n">joint_space</span><span class="p">:</span>
+</span><span id="extract_features_from_reference_JSON-415"><a href="#extract_features_from_reference_JSON-415"><span class="linenos">415</span></a>        <span class="k">for</span> <span class="n">individual_feature</span> <span class="ow">in</span> <span class="n">feature_tuple</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;,&#39;</span><span class="p">):</span>
+</span><span id="extract_features_from_reference_JSON-416"><a href="#extract_features_from_reference_JSON-416"><span class="linenos">416</span></a>            <span class="n">unique_features</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">individual_feature</span><span class="p">)</span>
+</span><span id="extract_features_from_reference_JSON-417"><a href="#extract_features_from_reference_JSON-417"><span class="linenos">417</span></a>
+</span><span id="extract_features_from_reference_JSON-418"><a href="#extract_features_from_reference_JSON-418"><span class="linenos">418</span></a>    <span class="k">return</span> <span class="n">unique_features</span>
 </span></pre></div>
 
 
@@ -1809,7 +1842,7 @@ <h1 class="modulename">
                 <section id="summarize_feature_bounds_for_transformers">
                             <input id="summarize_feature_bounds_for_transformers-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">summarize_feature_bounds_for_transformers</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">bounds_object_storage</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">feature_types</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span>,</span><span class="param">	<span class="n">task_name</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">label_name</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">granularity</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">15</span>,</span><span class="param">	<span class="n">output_summary_table_only</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span></span><span class="return-annotation">):</span></span>
 
@@ -1817,178 +1850,178 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#summarize_feature_bounds_for_transformers"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="summarize_feature_bounds_for_transformers-418"><a href="#summarize_feature_bounds_for_transformers-418"><span class="linenos">418</span></a><span class="k">def</span> <span class="nf">summarize_feature_bounds_for_transformers</span><span class="p">(</span>
-</span><span id="summarize_feature_bounds_for_transformers-419"><a href="#summarize_feature_bounds_for_transformers-419"><span class="linenos">419</span></a>    <span class="n">bounds_object_storage</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-420"><a href="#summarize_feature_bounds_for_transformers-420"><span class="linenos">420</span></a>    <span class="n">feature_types</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
-</span><span id="summarize_feature_bounds_for_transformers-421"><a href="#summarize_feature_bounds_for_transformers-421"><span class="linenos">421</span></a>    <span class="n">task_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-422"><a href="#summarize_feature_bounds_for_transformers-422"><span class="linenos">422</span></a>    <span class="n">label_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-423"><a href="#summarize_feature_bounds_for_transformers-423"><span class="linenos">423</span></a>    <span class="n">granularity</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">15</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-424"><a href="#summarize_feature_bounds_for_transformers-424"><span class="linenos">424</span></a>    <span class="n">output_summary_table_only</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-425"><a href="#summarize_feature_bounds_for_transformers-425"><span class="linenos">425</span></a><span class="p">):</span>
-</span><span id="summarize_feature_bounds_for_transformers-426"><a href="#summarize_feature_bounds_for_transformers-426"><span class="linenos">426</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;summarization auxilliary method for generating JSON-based specs&quot;&quot;&quot;</span>
-</span><span id="summarize_feature_bounds_for_transformers-427"><a href="#summarize_feature_bounds_for_transformers-427"><span class="linenos">427</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-428"><a href="#summarize_feature_bounds_for_transformers-428"><span class="linenos">428</span></a>    <span class="k">if</span> <span class="n">bounds_object_storage</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="summarize_feature_bounds_for_transformers-429"><a href="#summarize_feature_bounds_for_transformers-429"><span class="linenos">429</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Bounds storage object is empty.&#39;</span><span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-430"><a href="#summarize_feature_bounds_for_transformers-430"><span class="linenos">430</span></a>        <span class="n">exit</span><span class="p">()</span>
-</span><span id="summarize_feature_bounds_for_transformers-431"><a href="#summarize_feature_bounds_for_transformers-431"><span class="linenos">431</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-432"><a href="#summarize_feature_bounds_for_transformers-432"><span class="linenos">432</span></a>    <span class="n">final_storage</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-433"><a href="#summarize_feature_bounds_for_transformers-433"><span class="linenos">433</span></a>    <span class="k">for</span> <span class="n">el</span> <span class="ow">in</span> <span class="n">bounds_object_storage</span><span class="p">:</span>
-</span><span id="summarize_feature_bounds_for_transformers-434"><a href="#summarize_feature_bounds_for_transformers-434"><span class="linenos">434</span></a>        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">el</span><span class="p">,</span> <span class="nb">dict</span><span class="p">):</span>
-</span><span id="summarize_feature_bounds_for_transformers-435"><a href="#summarize_feature_bounds_for_transformers-435"><span class="linenos">435</span></a>            <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">el</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="summarize_feature_bounds_for_transformers-436"><a href="#summarize_feature_bounds_for_transformers-436"><span class="linenos">436</span></a>                <span class="n">final_storage</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">v</span><span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-437"><a href="#summarize_feature_bounds_for_transformers-437"><span class="linenos">437</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-438"><a href="#summarize_feature_bounds_for_transformers-438"><span class="linenos">438</span></a>    <span class="n">summary_table_rows</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="summarize_feature_bounds_for_transformers-439"><a href="#summarize_feature_bounds_for_transformers-439"><span class="linenos">439</span></a>    <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">final_storage</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="summarize_feature_bounds_for_transformers-440"><a href="#summarize_feature_bounds_for_transformers-440"><span class="linenos">440</span></a>        <span class="c1"># Conduct local aggregation + bound changes</span>
-</span><span id="summarize_feature_bounds_for_transformers-441"><a href="#summarize_feature_bounds_for_transformers-441"><span class="linenos">441</span></a>        <span class="k">if</span> <span class="n">k</span> <span class="ow">in</span> <span class="n">feature_types</span> <span class="ow">and</span> <span class="n">k</span> <span class="o">!=</span> <span class="n">label_name</span><span class="p">:</span>
-</span><span id="summarize_feature_bounds_for_transformers-442"><a href="#summarize_feature_bounds_for_transformers-442"><span class="linenos">442</span></a>            <span class="n">minima</span><span class="p">,</span> <span class="n">maxima</span><span class="p">,</span> <span class="n">medians</span><span class="p">,</span> <span class="n">uniques</span> <span class="o">=</span> <span class="p">[],</span> <span class="p">[],</span> <span class="p">[],</span> <span class="p">[]</span>
-</span><span id="summarize_feature_bounds_for_transformers-443"><a href="#summarize_feature_bounds_for_transformers-443"><span class="linenos">443</span></a>            <span class="k">for</span> <span class="n">feature_summary</span> <span class="ow">in</span> <span class="n">v</span><span class="p">:</span>
-</span><span id="summarize_feature_bounds_for_transformers-444"><a href="#summarize_feature_bounds_for_transformers-444"><span class="linenos">444</span></a>                <span class="n">minima</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">feature_summary</span><span class="o">.</span><span class="n">minimum</span><span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-445"><a href="#summarize_feature_bounds_for_transformers-445"><span class="linenos">445</span></a>                <span class="n">maxima</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">feature_summary</span><span class="o">.</span><span class="n">maximum</span><span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-446"><a href="#summarize_feature_bounds_for_transformers-446"><span class="linenos">446</span></a>                <span class="n">medians</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">feature_summary</span><span class="o">.</span><span class="n">median</span><span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-447"><a href="#summarize_feature_bounds_for_transformers-447"><span class="linenos">447</span></a>                <span class="n">uniques</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">feature_summary</span><span class="o">.</span><span class="n">num_unique</span><span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-448"><a href="#summarize_feature_bounds_for_transformers-448"><span class="linenos">448</span></a>            <span class="n">summary_table_rows</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-</span><span id="summarize_feature_bounds_for_transformers-449"><a href="#summarize_feature_bounds_for_transformers-449"><span class="linenos">449</span></a>                <span class="p">[</span>
-</span><span id="summarize_feature_bounds_for_transformers-450"><a href="#summarize_feature_bounds_for_transformers-450"><span class="linenos">450</span></a>                    <span class="n">k</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-451"><a href="#summarize_feature_bounds_for_transformers-451"><span class="linenos">451</span></a>                    <span class="nb">round</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">(</span><span class="n">minima</span><span class="p">),</span> <span class="mi">2</span><span class="p">),</span>
-</span><span id="summarize_feature_bounds_for_transformers-452"><a href="#summarize_feature_bounds_for_transformers-452"><span class="linenos">452</span></a>                    <span class="nb">round</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">maxima</span><span class="p">),</span> <span class="mi">2</span><span class="p">),</span>
-</span><span id="summarize_feature_bounds_for_transformers-453"><a href="#summarize_feature_bounds_for_transformers-453"><span class="linenos">453</span></a>                    <span class="nb">round</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="n">medians</span><span class="p">),</span> <span class="mi">2</span><span class="p">),</span>
-</span><span id="summarize_feature_bounds_for_transformers-454"><a href="#summarize_feature_bounds_for_transformers-454"><span class="linenos">454</span></a>                    <span class="nb">int</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">uniques</span><span class="p">)),</span>
-</span><span id="summarize_feature_bounds_for_transformers-455"><a href="#summarize_feature_bounds_for_transformers-455"><span class="linenos">455</span></a>                <span class="p">],</span>
-</span><span id="summarize_feature_bounds_for_transformers-456"><a href="#summarize_feature_bounds_for_transformers-456"><span class="linenos">456</span></a>            <span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-457"><a href="#summarize_feature_bounds_for_transformers-457"><span class="linenos">457</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-458"><a href="#summarize_feature_bounds_for_transformers-458"><span class="linenos">458</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">summary_table_rows</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="summarize_feature_bounds_for_transformers-459"><a href="#summarize_feature_bounds_for_transformers-459"><span class="linenos">459</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;No numeric features to summarize.&#39;</span><span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-460"><a href="#summarize_feature_bounds_for_transformers-460"><span class="linenos">460</span></a>        <span class="k">return</span> <span class="kc">None</span>
-</span><span id="summarize_feature_bounds_for_transformers-461"><a href="#summarize_feature_bounds_for_transformers-461"><span class="linenos">461</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-462"><a href="#summarize_feature_bounds_for_transformers-462"><span class="linenos">462</span></a>    <span class="n">summary_table</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">summary_table_rows</span><span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-463"><a href="#summarize_feature_bounds_for_transformers-463"><span class="linenos">463</span></a>    <span class="n">summary_table</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="summarize_feature_bounds_for_transformers-464"><a href="#summarize_feature_bounds_for_transformers-464"><span class="linenos">464</span></a>        <span class="s1">&#39;Feature&#39;</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-465"><a href="#summarize_feature_bounds_for_transformers-465"><span class="linenos">465</span></a>        <span class="s1">&#39;Minimum&#39;</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-466"><a href="#summarize_feature_bounds_for_transformers-466"><span class="linenos">466</span></a>        <span class="s1">&#39;Maximum&#39;</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-467"><a href="#summarize_feature_bounds_for_transformers-467"><span class="linenos">467</span></a>        <span class="s1">&#39;Median&#39;</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-468"><a href="#summarize_feature_bounds_for_transformers-468"><span class="linenos">468</span></a>        <span class="s1">&#39;Num avg. unique (batch)&#39;</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-469"><a href="#summarize_feature_bounds_for_transformers-469"><span class="linenos">469</span></a>    <span class="p">]</span>
-</span><span id="summarize_feature_bounds_for_transformers-470"><a href="#summarize_feature_bounds_for_transformers-470"><span class="linenos">470</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-471"><a href="#summarize_feature_bounds_for_transformers-471"><span class="linenos">471</span></a>    <span class="k">if</span> <span class="n">output_summary_table_only</span><span class="p">:</span>
-</span><span id="summarize_feature_bounds_for_transformers-472"><a href="#summarize_feature_bounds_for_transformers-472"><span class="linenos">472</span></a>        <span class="k">return</span> <span class="n">summary_table</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="summarize_feature_bounds_for_transformers-421"><a href="#summarize_feature_bounds_for_transformers-421"><span class="linenos">421</span></a><span class="k">def</span> <span class="nf">summarize_feature_bounds_for_transformers</span><span class="p">(</span>
+</span><span id="summarize_feature_bounds_for_transformers-422"><a href="#summarize_feature_bounds_for_transformers-422"><span class="linenos">422</span></a>    <span class="n">bounds_object_storage</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-423"><a href="#summarize_feature_bounds_for_transformers-423"><span class="linenos">423</span></a>    <span class="n">feature_types</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
+</span><span id="summarize_feature_bounds_for_transformers-424"><a href="#summarize_feature_bounds_for_transformers-424"><span class="linenos">424</span></a>    <span class="n">task_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-425"><a href="#summarize_feature_bounds_for_transformers-425"><span class="linenos">425</span></a>    <span class="n">label_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-426"><a href="#summarize_feature_bounds_for_transformers-426"><span class="linenos">426</span></a>    <span class="n">granularity</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">15</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-427"><a href="#summarize_feature_bounds_for_transformers-427"><span class="linenos">427</span></a>    <span class="n">output_summary_table_only</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-428"><a href="#summarize_feature_bounds_for_transformers-428"><span class="linenos">428</span></a><span class="p">):</span>
+</span><span id="summarize_feature_bounds_for_transformers-429"><a href="#summarize_feature_bounds_for_transformers-429"><span class="linenos">429</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;summarization auxilliary method for generating JSON-based specs&quot;&quot;&quot;</span>
+</span><span id="summarize_feature_bounds_for_transformers-430"><a href="#summarize_feature_bounds_for_transformers-430"><span class="linenos">430</span></a>
+</span><span id="summarize_feature_bounds_for_transformers-431"><a href="#summarize_feature_bounds_for_transformers-431"><span class="linenos">431</span></a>    <span class="k">if</span> <span class="n">bounds_object_storage</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="summarize_feature_bounds_for_transformers-432"><a href="#summarize_feature_bounds_for_transformers-432"><span class="linenos">432</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Bounds storage object is empty.&#39;</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-433"><a href="#summarize_feature_bounds_for_transformers-433"><span class="linenos">433</span></a>        <span class="n">exit</span><span class="p">()</span>
+</span><span id="summarize_feature_bounds_for_transformers-434"><a href="#summarize_feature_bounds_for_transformers-434"><span class="linenos">434</span></a>
+</span><span id="summarize_feature_bounds_for_transformers-435"><a href="#summarize_feature_bounds_for_transformers-435"><span class="linenos">435</span></a>    <span class="n">final_storage</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-436"><a href="#summarize_feature_bounds_for_transformers-436"><span class="linenos">436</span></a>    <span class="k">for</span> <span class="n">el</span> <span class="ow">in</span> <span class="n">bounds_object_storage</span><span class="p">:</span>
+</span><span id="summarize_feature_bounds_for_transformers-437"><a href="#summarize_feature_bounds_for_transformers-437"><span class="linenos">437</span></a>        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">el</span><span class="p">,</span> <span class="nb">dict</span><span class="p">):</span>
+</span><span id="summarize_feature_bounds_for_transformers-438"><a href="#summarize_feature_bounds_for_transformers-438"><span class="linenos">438</span></a>            <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">el</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="summarize_feature_bounds_for_transformers-439"><a href="#summarize_feature_bounds_for_transformers-439"><span class="linenos">439</span></a>                <span class="n">final_storage</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">v</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-440"><a href="#summarize_feature_bounds_for_transformers-440"><span class="linenos">440</span></a>
+</span><span id="summarize_feature_bounds_for_transformers-441"><a href="#summarize_feature_bounds_for_transformers-441"><span class="linenos">441</span></a>    <span class="n">summary_table_rows</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="summarize_feature_bounds_for_transformers-442"><a href="#summarize_feature_bounds_for_transformers-442"><span class="linenos">442</span></a>    <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">final_storage</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="summarize_feature_bounds_for_transformers-443"><a href="#summarize_feature_bounds_for_transformers-443"><span class="linenos">443</span></a>        <span class="c1"># Conduct local aggregation + bound changes</span>
+</span><span id="summarize_feature_bounds_for_transformers-444"><a href="#summarize_feature_bounds_for_transformers-444"><span class="linenos">444</span></a>        <span class="k">if</span> <span class="n">k</span> <span class="ow">in</span> <span class="n">feature_types</span> <span class="ow">and</span> <span class="n">k</span> <span class="o">!=</span> <span class="n">label_name</span><span class="p">:</span>
+</span><span id="summarize_feature_bounds_for_transformers-445"><a href="#summarize_feature_bounds_for_transformers-445"><span class="linenos">445</span></a>            <span class="n">minima</span><span class="p">,</span> <span class="n">maxima</span><span class="p">,</span> <span class="n">medians</span><span class="p">,</span> <span class="n">uniques</span> <span class="o">=</span> <span class="p">[],</span> <span class="p">[],</span> <span class="p">[],</span> <span class="p">[]</span>
+</span><span id="summarize_feature_bounds_for_transformers-446"><a href="#summarize_feature_bounds_for_transformers-446"><span class="linenos">446</span></a>            <span class="k">for</span> <span class="n">feature_summary</span> <span class="ow">in</span> <span class="n">v</span><span class="p">:</span>
+</span><span id="summarize_feature_bounds_for_transformers-447"><a href="#summarize_feature_bounds_for_transformers-447"><span class="linenos">447</span></a>                <span class="n">minima</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">feature_summary</span><span class="o">.</span><span class="n">minimum</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-448"><a href="#summarize_feature_bounds_for_transformers-448"><span class="linenos">448</span></a>                <span class="n">maxima</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">feature_summary</span><span class="o">.</span><span class="n">maximum</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-449"><a href="#summarize_feature_bounds_for_transformers-449"><span class="linenos">449</span></a>                <span class="n">medians</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">feature_summary</span><span class="o">.</span><span class="n">median</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-450"><a href="#summarize_feature_bounds_for_transformers-450"><span class="linenos">450</span></a>                <span class="n">uniques</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">feature_summary</span><span class="o">.</span><span class="n">num_unique</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-451"><a href="#summarize_feature_bounds_for_transformers-451"><span class="linenos">451</span></a>            <span class="n">summary_table_rows</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
+</span><span id="summarize_feature_bounds_for_transformers-452"><a href="#summarize_feature_bounds_for_transformers-452"><span class="linenos">452</span></a>                <span class="p">[</span>
+</span><span id="summarize_feature_bounds_for_transformers-453"><a href="#summarize_feature_bounds_for_transformers-453"><span class="linenos">453</span></a>                    <span class="n">k</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-454"><a href="#summarize_feature_bounds_for_transformers-454"><span class="linenos">454</span></a>                    <span class="nb">round</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">(</span><span class="n">minima</span><span class="p">),</span> <span class="mi">2</span><span class="p">),</span>
+</span><span id="summarize_feature_bounds_for_transformers-455"><a href="#summarize_feature_bounds_for_transformers-455"><span class="linenos">455</span></a>                    <span class="nb">round</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">maxima</span><span class="p">),</span> <span class="mi">2</span><span class="p">),</span>
+</span><span id="summarize_feature_bounds_for_transformers-456"><a href="#summarize_feature_bounds_for_transformers-456"><span class="linenos">456</span></a>                    <span class="nb">round</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="n">medians</span><span class="p">),</span> <span class="mi">2</span><span class="p">),</span>
+</span><span id="summarize_feature_bounds_for_transformers-457"><a href="#summarize_feature_bounds_for_transformers-457"><span class="linenos">457</span></a>                    <span class="nb">int</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">uniques</span><span class="p">)),</span>
+</span><span id="summarize_feature_bounds_for_transformers-458"><a href="#summarize_feature_bounds_for_transformers-458"><span class="linenos">458</span></a>                <span class="p">],</span>
+</span><span id="summarize_feature_bounds_for_transformers-459"><a href="#summarize_feature_bounds_for_transformers-459"><span class="linenos">459</span></a>            <span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-460"><a href="#summarize_feature_bounds_for_transformers-460"><span class="linenos">460</span></a>
+</span><span id="summarize_feature_bounds_for_transformers-461"><a href="#summarize_feature_bounds_for_transformers-461"><span class="linenos">461</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">summary_table_rows</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="summarize_feature_bounds_for_transformers-462"><a href="#summarize_feature_bounds_for_transformers-462"><span class="linenos">462</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;No numeric features to summarize.&#39;</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-463"><a href="#summarize_feature_bounds_for_transformers-463"><span class="linenos">463</span></a>        <span class="k">return</span> <span class="kc">None</span>
+</span><span id="summarize_feature_bounds_for_transformers-464"><a href="#summarize_feature_bounds_for_transformers-464"><span class="linenos">464</span></a>
+</span><span id="summarize_feature_bounds_for_transformers-465"><a href="#summarize_feature_bounds_for_transformers-465"><span class="linenos">465</span></a>    <span class="n">summary_table</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">Dataframe</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">summary_table_rows</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-466"><a href="#summarize_feature_bounds_for_transformers-466"><span class="linenos">466</span></a>    <span class="n">summary_table</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="summarize_feature_bounds_for_transformers-467"><a href="#summarize_feature_bounds_for_transformers-467"><span class="linenos">467</span></a>        <span class="s1">&#39;Feature&#39;</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-468"><a href="#summarize_feature_bounds_for_transformers-468"><span class="linenos">468</span></a>        <span class="s1">&#39;Minimum&#39;</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-469"><a href="#summarize_feature_bounds_for_transformers-469"><span class="linenos">469</span></a>        <span class="s1">&#39;Maximum&#39;</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-470"><a href="#summarize_feature_bounds_for_transformers-470"><span class="linenos">470</span></a>        <span class="s1">&#39;Median&#39;</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-471"><a href="#summarize_feature_bounds_for_transformers-471"><span class="linenos">471</span></a>        <span class="s1">&#39;Num avg. unique (batch)&#39;</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-472"><a href="#summarize_feature_bounds_for_transformers-472"><span class="linenos">472</span></a>    <span class="p">]</span>
 </span><span id="summarize_feature_bounds_for_transformers-473"><a href="#summarize_feature_bounds_for_transformers-473"><span class="linenos">473</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-474"><a href="#summarize_feature_bounds_for_transformers-474"><span class="linenos">474</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">summary_table</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="summarize_feature_bounds_for_transformers-475"><a href="#summarize_feature_bounds_for_transformers-475"><span class="linenos">475</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Summary table empty, skipping transformer generation ..&#39;</span><span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-476"><a href="#summarize_feature_bounds_for_transformers-476"><span class="linenos">476</span></a>        <span class="k">return</span>
-</span><span id="summarize_feature_bounds_for_transformers-477"><a href="#summarize_feature_bounds_for_transformers-477"><span class="linenos">477</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-478"><a href="#summarize_feature_bounds_for_transformers-478"><span class="linenos">478</span></a>    <span class="k">if</span> <span class="n">task_name</span> <span class="o">==</span> <span class="s1">&#39;feature_summary_transformers&#39;</span><span class="p">:</span>
-</span><span id="summarize_feature_bounds_for_transformers-479"><a href="#summarize_feature_bounds_for_transformers-479"><span class="linenos">479</span></a>        <span class="n">transformers_per_feature</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-474"><a href="#summarize_feature_bounds_for_transformers-474"><span class="linenos">474</span></a>    <span class="k">if</span> <span class="n">output_summary_table_only</span><span class="p">:</span>
+</span><span id="summarize_feature_bounds_for_transformers-475"><a href="#summarize_feature_bounds_for_transformers-475"><span class="linenos">475</span></a>        <span class="k">return</span> <span class="n">summary_table</span>
+</span><span id="summarize_feature_bounds_for_transformers-476"><a href="#summarize_feature_bounds_for_transformers-476"><span class="linenos">476</span></a>
+</span><span id="summarize_feature_bounds_for_transformers-477"><a href="#summarize_feature_bounds_for_transformers-477"><span class="linenos">477</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">summary_table</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="summarize_feature_bounds_for_transformers-478"><a href="#summarize_feature_bounds_for_transformers-478"><span class="linenos">478</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Summary table empty, skipping transformer generation ..&#39;</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-479"><a href="#summarize_feature_bounds_for_transformers-479"><span class="linenos">479</span></a>        <span class="k">return</span>
 </span><span id="summarize_feature_bounds_for_transformers-480"><a href="#summarize_feature_bounds_for_transformers-480"><span class="linenos">480</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-481"><a href="#summarize_feature_bounds_for_transformers-481"><span class="linenos">481</span></a>        <span class="c1"># Take care of weights first -&gt; range is pre-defined</span>
-</span><span id="summarize_feature_bounds_for_transformers-482"><a href="#summarize_feature_bounds_for_transformers-482"><span class="linenos">482</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">final_storage</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="summarize_feature_bounds_for_transformers-483"><a href="#summarize_feature_bounds_for_transformers-483"><span class="linenos">483</span></a>            <span class="k">if</span> <span class="n">label_name</span> <span class="ow">in</span> <span class="n">k</span> <span class="ow">or</span> <span class="s1">&#39;dummy&#39;</span> <span class="ow">in</span> <span class="n">k</span><span class="p">:</span>
-</span><span id="summarize_feature_bounds_for_transformers-484"><a href="#summarize_feature_bounds_for_transformers-484"><span class="linenos">484</span></a>                <span class="k">continue</span>
-</span><span id="summarize_feature_bounds_for_transformers-485"><a href="#summarize_feature_bounds_for_transformers-485"><span class="linenos">485</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-486"><a href="#summarize_feature_bounds_for_transformers-486"><span class="linenos">486</span></a>            <span class="n">weight_template</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="summarize_feature_bounds_for_transformers-487"><a href="#summarize_feature_bounds_for_transformers-487"><span class="linenos">487</span></a>                <span class="s1">&#39;feature&#39;</span><span class="p">:</span> <span class="n">k</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-488"><a href="#summarize_feature_bounds_for_transformers-488"><span class="linenos">488</span></a>                <span class="s1">&#39;src_features&#39;</span><span class="p">:</span> <span class="p">[</span><span class="n">k</span><span class="p">],</span>
-</span><span id="summarize_feature_bounds_for_transformers-489"><a href="#summarize_feature_bounds_for_transformers-489"><span class="linenos">489</span></a>                <span class="s1">&#39;transformations&#39;</span><span class="p">:</span> <span class="p">[</span><span class="s1">&#39;Weight&#39;</span><span class="p">],</span>
-</span><span id="summarize_feature_bounds_for_transformers-490"><a href="#summarize_feature_bounds_for_transformers-490"><span class="linenos">490</span></a>                <span class="s1">&#39;weights&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">,</span> <span class="mf">1.5</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">3</span><span class="p">,</span> <span class="mi">10</span><span class="p">],</span>
-</span><span id="summarize_feature_bounds_for_transformers-491"><a href="#summarize_feature_bounds_for_transformers-491"><span class="linenos">491</span></a>            <span class="p">}</span>
-</span><span id="summarize_feature_bounds_for_transformers-492"><a href="#summarize_feature_bounds_for_transformers-492"><span class="linenos">492</span></a>            <span class="n">transformers_per_feature</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">weight_template</span><span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-493"><a href="#summarize_feature_bounds_for_transformers-493"><span class="linenos">493</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-494"><a href="#summarize_feature_bounds_for_transformers-494"><span class="linenos">494</span></a>        <span class="c1"># Consider numeric transformations - pairs and single ones</span>
-</span><span id="summarize_feature_bounds_for_transformers-495"><a href="#summarize_feature_bounds_for_transformers-495"><span class="linenos">495</span></a>        <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">summary_table</span><span class="o">.</span><span class="n">iterrows</span><span class="p">():</span>
-</span><span id="summarize_feature_bounds_for_transformers-496"><a href="#summarize_feature_bounds_for_transformers-496"><span class="linenos">496</span></a>            <span class="k">if</span> <span class="n">row</span><span class="o">.</span><span class="n">Feature</span> <span class="o">==</span> <span class="s1">&#39;dummy&#39;</span><span class="p">:</span>
-</span><span id="summarize_feature_bounds_for_transformers-497"><a href="#summarize_feature_bounds_for_transformers-497"><span class="linenos">497</span></a>                <span class="k">continue</span>
-</span><span id="summarize_feature_bounds_for_transformers-498"><a href="#summarize_feature_bounds_for_transformers-498"><span class="linenos">498</span></a>            <span class="k">try</span><span class="p">:</span>
-</span><span id="summarize_feature_bounds_for_transformers-499"><a href="#summarize_feature_bounds_for_transformers-499"><span class="linenos">499</span></a>                <span class="n">actual_range</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="summarize_feature_bounds_for_transformers-500"><a href="#summarize_feature_bounds_for_transformers-500"><span class="linenos">500</span></a>                    <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span>
-</span><span id="summarize_feature_bounds_for_transformers-501"><a href="#summarize_feature_bounds_for_transformers-501"><span class="linenos">501</span></a>                        <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Minimum&#39;</span><span class="p">],</span>
-</span><span id="summarize_feature_bounds_for_transformers-502"><a href="#summarize_feature_bounds_for_transformers-502"><span class="linenos">502</span></a>                        <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Maximum&#39;</span><span class="p">],</span>
-</span><span id="summarize_feature_bounds_for_transformers-503"><a href="#summarize_feature_bounds_for_transformers-503"><span class="linenos">503</span></a>                        <span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s1">&#39;Maximum&#39;</span><span class="p">]</span> <span class="o">-</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Minimum&#39;</span><span class="p">])</span> <span class="o">/</span> <span class="n">granularity</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-504"><a href="#summarize_feature_bounds_for_transformers-504"><span class="linenos">504</span></a>                    <span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-505"><a href="#summarize_feature_bounds_for_transformers-505"><span class="linenos">505</span></a>                    <span class="o">.</span><span class="n">round</span><span class="p">(</span><span class="mi">2</span><span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-506"><a href="#summarize_feature_bounds_for_transformers-506"><span class="linenos">506</span></a>                    <span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-</span><span id="summarize_feature_bounds_for_transformers-507"><a href="#summarize_feature_bounds_for_transformers-507"><span class="linenos">507</span></a>                <span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-508"><a href="#summarize_feature_bounds_for_transformers-508"><span class="linenos">508</span></a>                <span class="n">binner_template</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="summarize_feature_bounds_for_transformers-509"><a href="#summarize_feature_bounds_for_transformers-509"><span class="linenos">509</span></a>                    <span class="s1">&#39;feature&#39;</span><span class="p">:</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-510"><a href="#summarize_feature_bounds_for_transformers-510"><span class="linenos">510</span></a>                    <span class="s1">&#39;src_features&#39;</span><span class="p">:</span> <span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">],</span>
-</span><span id="summarize_feature_bounds_for_transformers-511"><a href="#summarize_feature_bounds_for_transformers-511"><span class="linenos">511</span></a>                    <span class="s1">&#39;transformations&#39;</span><span class="p">:</span> <span class="p">[</span>
-</span><span id="summarize_feature_bounds_for_transformers-512"><a href="#summarize_feature_bounds_for_transformers-512"><span class="linenos">512</span></a>                        <span class="s1">&#39;BinnerSqrt&#39;</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-513"><a href="#summarize_feature_bounds_for_transformers-513"><span class="linenos">513</span></a>                        <span class="s1">&#39;BinnerLog&#39;</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-514"><a href="#summarize_feature_bounds_for_transformers-514"><span class="linenos">514</span></a>                        <span class="s1">&#39;BinnerSqrtPlain&#39;</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-515"><a href="#summarize_feature_bounds_for_transformers-515"><span class="linenos">515</span></a>                        <span class="s1">&#39;BinnerLogPlain&#39;</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-516"><a href="#summarize_feature_bounds_for_transformers-516"><span class="linenos">516</span></a>                    <span class="p">],</span>
-</span><span id="summarize_feature_bounds_for_transformers-517"><a href="#summarize_feature_bounds_for_transformers-517"><span class="linenos">517</span></a>                    <span class="s1">&#39;n&#39;</span><span class="p">:</span> <span class="n">actual_range</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-518"><a href="#summarize_feature_bounds_for_transformers-518"><span class="linenos">518</span></a>                    <span class="s1">&#39;resolutions&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mf">0.1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">8</span><span class="p">,</span> <span class="mi">16</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">64</span><span class="p">,</span> <span class="mi">128</span><span class="p">],</span>
-</span><span id="summarize_feature_bounds_for_transformers-519"><a href="#summarize_feature_bounds_for_transformers-519"><span class="linenos">519</span></a>                <span class="p">}</span>
-</span><span id="summarize_feature_bounds_for_transformers-520"><a href="#summarize_feature_bounds_for_transformers-520"><span class="linenos">520</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-521"><a href="#summarize_feature_bounds_for_transformers-521"><span class="linenos">521</span></a>            <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">es</span><span class="p">:</span>
-</span><span id="summarize_feature_bounds_for_transformers-522"><a href="#summarize_feature_bounds_for_transformers-522"><span class="linenos">522</span></a>                <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="summarize_feature_bounds_for_transformers-523"><a href="#summarize_feature_bounds_for_transformers-523"><span class="linenos">523</span></a>                    <span class="sa">f</span><span class="s1">&#39;</span><span class="se">\U0001F631</span><span class="s1"> Encountered </span><span class="si">{</span><span class="n">es</span><span class="si">}</span><span class="s1">. The problematic feature is: </span><span class="si">{</span><span class="n">row</span><span class="si">}</span><span class="s1">, skipping transformer for this feature ..&#39;</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-524"><a href="#summarize_feature_bounds_for_transformers-524"><span class="linenos">524</span></a>                <span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-525"><a href="#summarize_feature_bounds_for_transformers-525"><span class="linenos">525</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-526"><a href="#summarize_feature_bounds_for_transformers-526"><span class="linenos">526</span></a>            <span class="n">transformers_per_feature</span><span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">binner_template</span><span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-527"><a href="#summarize_feature_bounds_for_transformers-527"><span class="linenos">527</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-528"><a href="#summarize_feature_bounds_for_transformers-528"><span class="linenos">528</span></a>            <span class="c1"># We want the full loop here, due to asymmetry of transformation(s)</span>
-</span><span id="summarize_feature_bounds_for_transformers-529"><a href="#summarize_feature_bounds_for_transformers-529"><span class="linenos">529</span></a>            <span class="k">for</span> <span class="n">enx_second</span><span class="p">,</span> <span class="n">row_second</span> <span class="ow">in</span> <span class="n">summary_table</span><span class="o">.</span><span class="n">iterrows</span><span class="p">():</span>
-</span><span id="summarize_feature_bounds_for_transformers-530"><a href="#summarize_feature_bounds_for_transformers-530"><span class="linenos">530</span></a>                <span class="k">if</span> <span class="n">enx_second</span> <span class="o">&lt;</span> <span class="n">enx</span><span class="p">:</span>
-</span><span id="summarize_feature_bounds_for_transformers-531"><a href="#summarize_feature_bounds_for_transformers-531"><span class="linenos">531</span></a>                    <span class="k">continue</span>
-</span><span id="summarize_feature_bounds_for_transformers-532"><a href="#summarize_feature_bounds_for_transformers-532"><span class="linenos">532</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-533"><a href="#summarize_feature_bounds_for_transformers-533"><span class="linenos">533</span></a>                <span class="c1"># The n values are defined based on maxima of the second feature</span>
-</span><span id="summarize_feature_bounds_for_transformers-534"><a href="#summarize_feature_bounds_for_transformers-534"><span class="linenos">534</span></a>                <span class="k">if</span> <span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span> <span class="o">!=</span> <span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">:</span>
-</span><span id="summarize_feature_bounds_for_transformers-535"><a href="#summarize_feature_bounds_for_transformers-535"><span class="linenos">535</span></a>                    <span class="n">n_bound</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">row_second</span><span class="p">[</span><span class="s1">&#39;Median&#39;</span><span class="p">]</span> <span class="o">+</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Median&#39;</span><span class="p">],</span> <span class="mi">2</span><span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-536"><a href="#summarize_feature_bounds_for_transformers-536"><span class="linenos">536</span></a>                    <span class="n">max_bound</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span>
-</span><span id="summarize_feature_bounds_for_transformers-537"><a href="#summarize_feature_bounds_for_transformers-537"><span class="linenos">537</span></a>                        <span class="nb">min</span><span class="p">(</span><span class="n">row_second</span><span class="p">[</span><span class="s1">&#39;Maximum&#39;</span><span class="p">],</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Maximum&#39;</span><span class="p">]),</span> <span class="mi">2</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-538"><a href="#summarize_feature_bounds_for_transformers-538"><span class="linenos">538</span></a>                    <span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-539"><a href="#summarize_feature_bounds_for_transformers-539"><span class="linenos">539</span></a>                    <span class="n">min_bound</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span>
-</span><span id="summarize_feature_bounds_for_transformers-540"><a href="#summarize_feature_bounds_for_transformers-540"><span class="linenos">540</span></a>                        <span class="n">row_second</span><span class="p">[</span><span class="s1">&#39;Minimum&#39;</span><span class="p">]</span> <span class="o">+</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Minimum&#39;</span><span class="p">],</span> <span class="mi">2</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-481"><a href="#summarize_feature_bounds_for_transformers-481"><span class="linenos">481</span></a>    <span class="k">if</span> <span class="n">task_name</span> <span class="o">==</span> <span class="s1">&#39;feature_summary_transformers&#39;</span><span class="p">:</span>
+</span><span id="summarize_feature_bounds_for_transformers-482"><a href="#summarize_feature_bounds_for_transformers-482"><span class="linenos">482</span></a>        <span class="n">transformers_per_feature</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-483"><a href="#summarize_feature_bounds_for_transformers-483"><span class="linenos">483</span></a>
+</span><span id="summarize_feature_bounds_for_transformers-484"><a href="#summarize_feature_bounds_for_transformers-484"><span class="linenos">484</span></a>        <span class="c1"># Take care of weights first -&gt; range is pre-defined</span>
+</span><span id="summarize_feature_bounds_for_transformers-485"><a href="#summarize_feature_bounds_for_transformers-485"><span class="linenos">485</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">final_storage</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="summarize_feature_bounds_for_transformers-486"><a href="#summarize_feature_bounds_for_transformers-486"><span class="linenos">486</span></a>            <span class="k">if</span> <span class="n">label_name</span> <span class="ow">in</span> <span class="n">k</span> <span class="ow">or</span> <span class="s1">&#39;dummy&#39;</span> <span class="ow">in</span> <span class="n">k</span><span class="p">:</span>
+</span><span id="summarize_feature_bounds_for_transformers-487"><a href="#summarize_feature_bounds_for_transformers-487"><span class="linenos">487</span></a>                <span class="k">continue</span>
+</span><span id="summarize_feature_bounds_for_transformers-488"><a href="#summarize_feature_bounds_for_transformers-488"><span class="linenos">488</span></a>
+</span><span id="summarize_feature_bounds_for_transformers-489"><a href="#summarize_feature_bounds_for_transformers-489"><span class="linenos">489</span></a>            <span class="n">weight_template</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="summarize_feature_bounds_for_transformers-490"><a href="#summarize_feature_bounds_for_transformers-490"><span class="linenos">490</span></a>                <span class="s1">&#39;feature&#39;</span><span class="p">:</span> <span class="n">k</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-491"><a href="#summarize_feature_bounds_for_transformers-491"><span class="linenos">491</span></a>                <span class="s1">&#39;src_features&#39;</span><span class="p">:</span> <span class="p">[</span><span class="n">k</span><span class="p">],</span>
+</span><span id="summarize_feature_bounds_for_transformers-492"><a href="#summarize_feature_bounds_for_transformers-492"><span class="linenos">492</span></a>                <span class="s1">&#39;transformations&#39;</span><span class="p">:</span> <span class="p">[</span><span class="s1">&#39;Weight&#39;</span><span class="p">],</span>
+</span><span id="summarize_feature_bounds_for_transformers-493"><a href="#summarize_feature_bounds_for_transformers-493"><span class="linenos">493</span></a>                <span class="s1">&#39;weights&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">,</span> <span class="mf">1.5</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">3</span><span class="p">,</span> <span class="mi">10</span><span class="p">],</span>
+</span><span id="summarize_feature_bounds_for_transformers-494"><a href="#summarize_feature_bounds_for_transformers-494"><span class="linenos">494</span></a>            <span class="p">}</span>
+</span><span id="summarize_feature_bounds_for_transformers-495"><a href="#summarize_feature_bounds_for_transformers-495"><span class="linenos">495</span></a>            <span class="n">transformers_per_feature</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">weight_template</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-496"><a href="#summarize_feature_bounds_for_transformers-496"><span class="linenos">496</span></a>
+</span><span id="summarize_feature_bounds_for_transformers-497"><a href="#summarize_feature_bounds_for_transformers-497"><span class="linenos">497</span></a>        <span class="c1"># Consider numeric transformations - pairs and single ones</span>
+</span><span id="summarize_feature_bounds_for_transformers-498"><a href="#summarize_feature_bounds_for_transformers-498"><span class="linenos">498</span></a>        <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">summary_table</span><span class="o">.</span><span class="n">iterrows</span><span class="p">():</span>
+</span><span id="summarize_feature_bounds_for_transformers-499"><a href="#summarize_feature_bounds_for_transformers-499"><span class="linenos">499</span></a>            <span class="k">if</span> <span class="n">row</span><span class="o">.</span><span class="n">Feature</span> <span class="o">==</span> <span class="s1">&#39;dummy&#39;</span><span class="p">:</span>
+</span><span id="summarize_feature_bounds_for_transformers-500"><a href="#summarize_feature_bounds_for_transformers-500"><span class="linenos">500</span></a>                <span class="k">continue</span>
+</span><span id="summarize_feature_bounds_for_transformers-501"><a href="#summarize_feature_bounds_for_transformers-501"><span class="linenos">501</span></a>            <span class="k">try</span><span class="p">:</span>
+</span><span id="summarize_feature_bounds_for_transformers-502"><a href="#summarize_feature_bounds_for_transformers-502"><span class="linenos">502</span></a>                <span class="n">actual_range</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="summarize_feature_bounds_for_transformers-503"><a href="#summarize_feature_bounds_for_transformers-503"><span class="linenos">503</span></a>                    <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span>
+</span><span id="summarize_feature_bounds_for_transformers-504"><a href="#summarize_feature_bounds_for_transformers-504"><span class="linenos">504</span></a>                        <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Minimum&#39;</span><span class="p">],</span>
+</span><span id="summarize_feature_bounds_for_transformers-505"><a href="#summarize_feature_bounds_for_transformers-505"><span class="linenos">505</span></a>                        <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Maximum&#39;</span><span class="p">],</span>
+</span><span id="summarize_feature_bounds_for_transformers-506"><a href="#summarize_feature_bounds_for_transformers-506"><span class="linenos">506</span></a>                        <span class="p">(</span><span class="n">row</span><span class="p">[</span><span class="s1">&#39;Maximum&#39;</span><span class="p">]</span> <span class="o">-</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Minimum&#39;</span><span class="p">])</span> <span class="o">/</span> <span class="n">granularity</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-507"><a href="#summarize_feature_bounds_for_transformers-507"><span class="linenos">507</span></a>                    <span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-508"><a href="#summarize_feature_bounds_for_transformers-508"><span class="linenos">508</span></a>                    <span class="o">.</span><span class="n">round</span><span class="p">(</span><span class="mi">2</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-509"><a href="#summarize_feature_bounds_for_transformers-509"><span class="linenos">509</span></a>                    <span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
+</span><span id="summarize_feature_bounds_for_transformers-510"><a href="#summarize_feature_bounds_for_transformers-510"><span class="linenos">510</span></a>                <span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-511"><a href="#summarize_feature_bounds_for_transformers-511"><span class="linenos">511</span></a>                <span class="n">binner_template</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="summarize_feature_bounds_for_transformers-512"><a href="#summarize_feature_bounds_for_transformers-512"><span class="linenos">512</span></a>                    <span class="s1">&#39;feature&#39;</span><span class="p">:</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-513"><a href="#summarize_feature_bounds_for_transformers-513"><span class="linenos">513</span></a>                    <span class="s1">&#39;src_features&#39;</span><span class="p">:</span> <span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">],</span>
+</span><span id="summarize_feature_bounds_for_transformers-514"><a href="#summarize_feature_bounds_for_transformers-514"><span class="linenos">514</span></a>                    <span class="s1">&#39;transformations&#39;</span><span class="p">:</span> <span class="p">[</span>
+</span><span id="summarize_feature_bounds_for_transformers-515"><a href="#summarize_feature_bounds_for_transformers-515"><span class="linenos">515</span></a>                        <span class="s1">&#39;BinnerSqrt&#39;</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-516"><a href="#summarize_feature_bounds_for_transformers-516"><span class="linenos">516</span></a>                        <span class="s1">&#39;BinnerLog&#39;</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-517"><a href="#summarize_feature_bounds_for_transformers-517"><span class="linenos">517</span></a>                        <span class="s1">&#39;BinnerSqrtPlain&#39;</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-518"><a href="#summarize_feature_bounds_for_transformers-518"><span class="linenos">518</span></a>                        <span class="s1">&#39;BinnerLogPlain&#39;</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-519"><a href="#summarize_feature_bounds_for_transformers-519"><span class="linenos">519</span></a>                    <span class="p">],</span>
+</span><span id="summarize_feature_bounds_for_transformers-520"><a href="#summarize_feature_bounds_for_transformers-520"><span class="linenos">520</span></a>                    <span class="s1">&#39;n&#39;</span><span class="p">:</span> <span class="n">actual_range</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-521"><a href="#summarize_feature_bounds_for_transformers-521"><span class="linenos">521</span></a>                    <span class="s1">&#39;resolutions&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mf">0.1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">8</span><span class="p">,</span> <span class="mi">16</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">64</span><span class="p">,</span> <span class="mi">128</span><span class="p">],</span>
+</span><span id="summarize_feature_bounds_for_transformers-522"><a href="#summarize_feature_bounds_for_transformers-522"><span class="linenos">522</span></a>                <span class="p">}</span>
+</span><span id="summarize_feature_bounds_for_transformers-523"><a href="#summarize_feature_bounds_for_transformers-523"><span class="linenos">523</span></a>
+</span><span id="summarize_feature_bounds_for_transformers-524"><a href="#summarize_feature_bounds_for_transformers-524"><span class="linenos">524</span></a>            <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">es</span><span class="p">:</span>
+</span><span id="summarize_feature_bounds_for_transformers-525"><a href="#summarize_feature_bounds_for_transformers-525"><span class="linenos">525</span></a>                <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="summarize_feature_bounds_for_transformers-526"><a href="#summarize_feature_bounds_for_transformers-526"><span class="linenos">526</span></a>                    <span class="sa">f</span><span class="s1">&#39;</span><span class="se">\U0001F631</span><span class="s1"> Encountered </span><span class="si">{</span><span class="n">es</span><span class="si">}</span><span class="s1">. The problematic feature is: </span><span class="si">{</span><span class="n">row</span><span class="si">}</span><span class="s1">, skipping transformer for this feature ..&#39;</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-527"><a href="#summarize_feature_bounds_for_transformers-527"><span class="linenos">527</span></a>                <span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-528"><a href="#summarize_feature_bounds_for_transformers-528"><span class="linenos">528</span></a>
+</span><span id="summarize_feature_bounds_for_transformers-529"><a href="#summarize_feature_bounds_for_transformers-529"><span class="linenos">529</span></a>            <span class="n">transformers_per_feature</span><span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">binner_template</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-530"><a href="#summarize_feature_bounds_for_transformers-530"><span class="linenos">530</span></a>
+</span><span id="summarize_feature_bounds_for_transformers-531"><a href="#summarize_feature_bounds_for_transformers-531"><span class="linenos">531</span></a>            <span class="c1"># We want the full loop here, due to asymmetry of transformation(s)</span>
+</span><span id="summarize_feature_bounds_for_transformers-532"><a href="#summarize_feature_bounds_for_transformers-532"><span class="linenos">532</span></a>            <span class="k">for</span> <span class="n">enx_second</span><span class="p">,</span> <span class="n">row_second</span> <span class="ow">in</span> <span class="n">summary_table</span><span class="o">.</span><span class="n">iterrows</span><span class="p">():</span>
+</span><span id="summarize_feature_bounds_for_transformers-533"><a href="#summarize_feature_bounds_for_transformers-533"><span class="linenos">533</span></a>                <span class="k">if</span> <span class="n">enx_second</span> <span class="o">&lt;</span> <span class="n">enx</span><span class="p">:</span>
+</span><span id="summarize_feature_bounds_for_transformers-534"><a href="#summarize_feature_bounds_for_transformers-534"><span class="linenos">534</span></a>                    <span class="k">continue</span>
+</span><span id="summarize_feature_bounds_for_transformers-535"><a href="#summarize_feature_bounds_for_transformers-535"><span class="linenos">535</span></a>
+</span><span id="summarize_feature_bounds_for_transformers-536"><a href="#summarize_feature_bounds_for_transformers-536"><span class="linenos">536</span></a>                <span class="c1"># The n values are defined based on maxima of the second feature</span>
+</span><span id="summarize_feature_bounds_for_transformers-537"><a href="#summarize_feature_bounds_for_transformers-537"><span class="linenos">537</span></a>                <span class="k">if</span> <span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span> <span class="o">!=</span> <span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">:</span>
+</span><span id="summarize_feature_bounds_for_transformers-538"><a href="#summarize_feature_bounds_for_transformers-538"><span class="linenos">538</span></a>                    <span class="n">n_bound</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">row_second</span><span class="p">[</span><span class="s1">&#39;Median&#39;</span><span class="p">]</span> <span class="o">+</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Median&#39;</span><span class="p">],</span> <span class="mi">2</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-539"><a href="#summarize_feature_bounds_for_transformers-539"><span class="linenos">539</span></a>                    <span class="n">max_bound</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span>
+</span><span id="summarize_feature_bounds_for_transformers-540"><a href="#summarize_feature_bounds_for_transformers-540"><span class="linenos">540</span></a>                        <span class="nb">min</span><span class="p">(</span><span class="n">row_second</span><span class="p">[</span><span class="s1">&#39;Maximum&#39;</span><span class="p">],</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Maximum&#39;</span><span class="p">]),</span> <span class="mi">2</span><span class="p">,</span>
 </span><span id="summarize_feature_bounds_for_transformers-541"><a href="#summarize_feature_bounds_for_transformers-541"><span class="linenos">541</span></a>                    <span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-542"><a href="#summarize_feature_bounds_for_transformers-542"><span class="linenos">542</span></a>                    <span class="n">range_spectrum</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span>
-</span><span id="summarize_feature_bounds_for_transformers-543"><a href="#summarize_feature_bounds_for_transformers-543"><span class="linenos">543</span></a>                        <span class="nb">list</span><span class="p">(</span>
-</span><span id="summarize_feature_bounds_for_transformers-544"><a href="#summarize_feature_bounds_for_transformers-544"><span class="linenos">544</span></a>                            <span class="p">{</span>
-</span><span id="summarize_feature_bounds_for_transformers-545"><a href="#summarize_feature_bounds_for_transformers-545"><span class="linenos">545</span></a>                                <span class="mf">0.0</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-546"><a href="#summarize_feature_bounds_for_transformers-546"><span class="linenos">546</span></a>                                <span class="n">min_bound</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-547"><a href="#summarize_feature_bounds_for_transformers-547"><span class="linenos">547</span></a>                                <span class="n">n_bound</span> <span class="o">/</span> <span class="mi">10</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-548"><a href="#summarize_feature_bounds_for_transformers-548"><span class="linenos">548</span></a>                                <span class="n">n_bound</span> <span class="o">/</span> <span class="mi">5</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-549"><a href="#summarize_feature_bounds_for_transformers-549"><span class="linenos">549</span></a>                                <span class="n">n_bound</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-550"><a href="#summarize_feature_bounds_for_transformers-550"><span class="linenos">550</span></a>                                <span class="n">max_bound</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-551"><a href="#summarize_feature_bounds_for_transformers-551"><span class="linenos">551</span></a>                            <span class="p">},</span>
-</span><span id="summarize_feature_bounds_for_transformers-552"><a href="#summarize_feature_bounds_for_transformers-552"><span class="linenos">552</span></a>                        <span class="p">),</span>
-</span><span id="summarize_feature_bounds_for_transformers-553"><a href="#summarize_feature_bounds_for_transformers-553"><span class="linenos">553</span></a>                    <span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-554"><a href="#summarize_feature_bounds_for_transformers-554"><span class="linenos">554</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-555"><a href="#summarize_feature_bounds_for_transformers-555"><span class="linenos">555</span></a>                    <span class="n">range_spectrum</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">range_spectrum</span> <span class="k">if</span> <span class="n">x</span> <span class="o">&gt;=</span> <span class="mi">0</span><span class="p">]</span>
-</span><span id="summarize_feature_bounds_for_transformers-556"><a href="#summarize_feature_bounds_for_transformers-556"><span class="linenos">556</span></a>                    <span class="n">binner_pair_template</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="summarize_feature_bounds_for_transformers-557"><a href="#summarize_feature_bounds_for_transformers-557"><span class="linenos">557</span></a>                        <span class="s1">&#39;feature&#39;</span><span class="p">:</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">Ratio</span><span class="si">{</span><span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-558"><a href="#summarize_feature_bounds_for_transformers-558"><span class="linenos">558</span></a>                        <span class="s1">&#39;src_features&#39;</span><span class="p">:</span> <span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">,</span> <span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span><span class="p">],</span>
-</span><span id="summarize_feature_bounds_for_transformers-559"><a href="#summarize_feature_bounds_for_transformers-559"><span class="linenos">559</span></a>                        <span class="s1">&#39;transformations&#39;</span><span class="p">:</span> <span class="p">[</span><span class="s1">&#39;BinnerLogRatioPlain&#39;</span><span class="p">,</span> <span class="s1">&#39;BinnerLogRatio&#39;</span><span class="p">],</span>
-</span><span id="summarize_feature_bounds_for_transformers-560"><a href="#summarize_feature_bounds_for_transformers-560"><span class="linenos">560</span></a>                        <span class="s1">&#39;n&#39;</span><span class="p">:</span> <span class="n">range_spectrum</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-561"><a href="#summarize_feature_bounds_for_transformers-561"><span class="linenos">561</span></a>                        <span class="s1">&#39;resolutions&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mf">0.1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">8</span><span class="p">,</span> <span class="mi">16</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">64</span><span class="p">,</span> <span class="mi">128</span><span class="p">],</span>
-</span><span id="summarize_feature_bounds_for_transformers-562"><a href="#summarize_feature_bounds_for_transformers-562"><span class="linenos">562</span></a>                    <span class="p">}</span>
-</span><span id="summarize_feature_bounds_for_transformers-563"><a href="#summarize_feature_bounds_for_transformers-563"><span class="linenos">563</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-564"><a href="#summarize_feature_bounds_for_transformers-564"><span class="linenos">564</span></a>                    <span class="n">binner_pair_template_second</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="summarize_feature_bounds_for_transformers-565"><a href="#summarize_feature_bounds_for_transformers-565"><span class="linenos">565</span></a>                        <span class="s1">&#39;feature&#39;</span><span class="p">:</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">Ratio</span><span class="si">{</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-566"><a href="#summarize_feature_bounds_for_transformers-566"><span class="linenos">566</span></a>                        <span class="s1">&#39;src_features&#39;</span><span class="p">:</span> <span class="p">[</span><span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span><span class="p">,</span> <span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">],</span>
-</span><span id="summarize_feature_bounds_for_transformers-567"><a href="#summarize_feature_bounds_for_transformers-567"><span class="linenos">567</span></a>                        <span class="s1">&#39;transformations&#39;</span><span class="p">:</span> <span class="p">[</span><span class="s1">&#39;BinnerLogRatioPlain&#39;</span><span class="p">,</span> <span class="s1">&#39;BinnerLogRatio&#39;</span><span class="p">],</span>
-</span><span id="summarize_feature_bounds_for_transformers-568"><a href="#summarize_feature_bounds_for_transformers-568"><span class="linenos">568</span></a>                        <span class="s1">&#39;n&#39;</span><span class="p">:</span> <span class="n">range_spectrum</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-569"><a href="#summarize_feature_bounds_for_transformers-569"><span class="linenos">569</span></a>                        <span class="s1">&#39;resolutions&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mf">0.1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">8</span><span class="p">,</span> <span class="mi">16</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">64</span><span class="p">,</span> <span class="mi">128</span><span class="p">],</span>
-</span><span id="summarize_feature_bounds_for_transformers-570"><a href="#summarize_feature_bounds_for_transformers-570"><span class="linenos">570</span></a>                    <span class="p">}</span>
-</span><span id="summarize_feature_bounds_for_transformers-571"><a href="#summarize_feature_bounds_for_transformers-571"><span class="linenos">571</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-572"><a href="#summarize_feature_bounds_for_transformers-572"><span class="linenos">572</span></a>                    <span class="n">transformers_per_feature</span><span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-</span><span id="summarize_feature_bounds_for_transformers-573"><a href="#summarize_feature_bounds_for_transformers-573"><span class="linenos">573</span></a>                        <span class="n">binner_pair_template</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-574"><a href="#summarize_feature_bounds_for_transformers-574"><span class="linenos">574</span></a>                    <span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-542"><a href="#summarize_feature_bounds_for_transformers-542"><span class="linenos">542</span></a>                    <span class="n">min_bound</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span>
+</span><span id="summarize_feature_bounds_for_transformers-543"><a href="#summarize_feature_bounds_for_transformers-543"><span class="linenos">543</span></a>                        <span class="n">row_second</span><span class="p">[</span><span class="s1">&#39;Minimum&#39;</span><span class="p">]</span> <span class="o">+</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Minimum&#39;</span><span class="p">],</span> <span class="mi">2</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-544"><a href="#summarize_feature_bounds_for_transformers-544"><span class="linenos">544</span></a>                    <span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-545"><a href="#summarize_feature_bounds_for_transformers-545"><span class="linenos">545</span></a>                    <span class="n">range_spectrum</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span>
+</span><span id="summarize_feature_bounds_for_transformers-546"><a href="#summarize_feature_bounds_for_transformers-546"><span class="linenos">546</span></a>                        <span class="nb">list</span><span class="p">(</span>
+</span><span id="summarize_feature_bounds_for_transformers-547"><a href="#summarize_feature_bounds_for_transformers-547"><span class="linenos">547</span></a>                            <span class="p">{</span>
+</span><span id="summarize_feature_bounds_for_transformers-548"><a href="#summarize_feature_bounds_for_transformers-548"><span class="linenos">548</span></a>                                <span class="mf">0.0</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-549"><a href="#summarize_feature_bounds_for_transformers-549"><span class="linenos">549</span></a>                                <span class="n">min_bound</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-550"><a href="#summarize_feature_bounds_for_transformers-550"><span class="linenos">550</span></a>                                <span class="n">n_bound</span> <span class="o">/</span> <span class="mi">10</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-551"><a href="#summarize_feature_bounds_for_transformers-551"><span class="linenos">551</span></a>                                <span class="n">n_bound</span> <span class="o">/</span> <span class="mi">5</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-552"><a href="#summarize_feature_bounds_for_transformers-552"><span class="linenos">552</span></a>                                <span class="n">n_bound</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-553"><a href="#summarize_feature_bounds_for_transformers-553"><span class="linenos">553</span></a>                                <span class="n">max_bound</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-554"><a href="#summarize_feature_bounds_for_transformers-554"><span class="linenos">554</span></a>                            <span class="p">},</span>
+</span><span id="summarize_feature_bounds_for_transformers-555"><a href="#summarize_feature_bounds_for_transformers-555"><span class="linenos">555</span></a>                        <span class="p">),</span>
+</span><span id="summarize_feature_bounds_for_transformers-556"><a href="#summarize_feature_bounds_for_transformers-556"><span class="linenos">556</span></a>                    <span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-557"><a href="#summarize_feature_bounds_for_transformers-557"><span class="linenos">557</span></a>
+</span><span id="summarize_feature_bounds_for_transformers-558"><a href="#summarize_feature_bounds_for_transformers-558"><span class="linenos">558</span></a>                    <span class="n">range_spectrum</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">range_spectrum</span> <span class="k">if</span> <span class="n">x</span> <span class="o">&gt;=</span> <span class="mi">0</span><span class="p">]</span>
+</span><span id="summarize_feature_bounds_for_transformers-559"><a href="#summarize_feature_bounds_for_transformers-559"><span class="linenos">559</span></a>                    <span class="n">binner_pair_template</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="summarize_feature_bounds_for_transformers-560"><a href="#summarize_feature_bounds_for_transformers-560"><span class="linenos">560</span></a>                        <span class="s1">&#39;feature&#39;</span><span class="p">:</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">Ratio</span><span class="si">{</span><span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-561"><a href="#summarize_feature_bounds_for_transformers-561"><span class="linenos">561</span></a>                        <span class="s1">&#39;src_features&#39;</span><span class="p">:</span> <span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">,</span> <span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span><span class="p">],</span>
+</span><span id="summarize_feature_bounds_for_transformers-562"><a href="#summarize_feature_bounds_for_transformers-562"><span class="linenos">562</span></a>                        <span class="s1">&#39;transformations&#39;</span><span class="p">:</span> <span class="p">[</span><span class="s1">&#39;BinnerLogRatioPlain&#39;</span><span class="p">,</span> <span class="s1">&#39;BinnerLogRatio&#39;</span><span class="p">],</span>
+</span><span id="summarize_feature_bounds_for_transformers-563"><a href="#summarize_feature_bounds_for_transformers-563"><span class="linenos">563</span></a>                        <span class="s1">&#39;n&#39;</span><span class="p">:</span> <span class="n">range_spectrum</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-564"><a href="#summarize_feature_bounds_for_transformers-564"><span class="linenos">564</span></a>                        <span class="s1">&#39;resolutions&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mf">0.1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">8</span><span class="p">,</span> <span class="mi">16</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">64</span><span class="p">,</span> <span class="mi">128</span><span class="p">],</span>
+</span><span id="summarize_feature_bounds_for_transformers-565"><a href="#summarize_feature_bounds_for_transformers-565"><span class="linenos">565</span></a>                    <span class="p">}</span>
+</span><span id="summarize_feature_bounds_for_transformers-566"><a href="#summarize_feature_bounds_for_transformers-566"><span class="linenos">566</span></a>
+</span><span id="summarize_feature_bounds_for_transformers-567"><a href="#summarize_feature_bounds_for_transformers-567"><span class="linenos">567</span></a>                    <span class="n">binner_pair_template_second</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="summarize_feature_bounds_for_transformers-568"><a href="#summarize_feature_bounds_for_transformers-568"><span class="linenos">568</span></a>                        <span class="s1">&#39;feature&#39;</span><span class="p">:</span> <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">Ratio</span><span class="si">{</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-569"><a href="#summarize_feature_bounds_for_transformers-569"><span class="linenos">569</span></a>                        <span class="s1">&#39;src_features&#39;</span><span class="p">:</span> <span class="p">[</span><span class="n">row_second</span><span class="o">.</span><span class="n">Feature</span><span class="p">,</span> <span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">],</span>
+</span><span id="summarize_feature_bounds_for_transformers-570"><a href="#summarize_feature_bounds_for_transformers-570"><span class="linenos">570</span></a>                        <span class="s1">&#39;transformations&#39;</span><span class="p">:</span> <span class="p">[</span><span class="s1">&#39;BinnerLogRatioPlain&#39;</span><span class="p">,</span> <span class="s1">&#39;BinnerLogRatio&#39;</span><span class="p">],</span>
+</span><span id="summarize_feature_bounds_for_transformers-571"><a href="#summarize_feature_bounds_for_transformers-571"><span class="linenos">571</span></a>                        <span class="s1">&#39;n&#39;</span><span class="p">:</span> <span class="n">range_spectrum</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-572"><a href="#summarize_feature_bounds_for_transformers-572"><span class="linenos">572</span></a>                        <span class="s1">&#39;resolutions&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mf">0.1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">8</span><span class="p">,</span> <span class="mi">16</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">64</span><span class="p">,</span> <span class="mi">128</span><span class="p">],</span>
+</span><span id="summarize_feature_bounds_for_transformers-573"><a href="#summarize_feature_bounds_for_transformers-573"><span class="linenos">573</span></a>                    <span class="p">}</span>
+</span><span id="summarize_feature_bounds_for_transformers-574"><a href="#summarize_feature_bounds_for_transformers-574"><span class="linenos">574</span></a>
 </span><span id="summarize_feature_bounds_for_transformers-575"><a href="#summarize_feature_bounds_for_transformers-575"><span class="linenos">575</span></a>                    <span class="n">transformers_per_feature</span><span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-</span><span id="summarize_feature_bounds_for_transformers-576"><a href="#summarize_feature_bounds_for_transformers-576"><span class="linenos">576</span></a>                        <span class="n">binner_pair_template_second</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-576"><a href="#summarize_feature_bounds_for_transformers-576"><span class="linenos">576</span></a>                        <span class="n">binner_pair_template</span><span class="p">,</span>
 </span><span id="summarize_feature_bounds_for_transformers-577"><a href="#summarize_feature_bounds_for_transformers-577"><span class="linenos">577</span></a>                    <span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-578"><a href="#summarize_feature_bounds_for_transformers-578"><span class="linenos">578</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-579"><a href="#summarize_feature_bounds_for_transformers-579"><span class="linenos">579</span></a>        <span class="n">binner_templates</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="summarize_feature_bounds_for_transformers-580"><a href="#summarize_feature_bounds_for_transformers-580"><span class="linenos">580</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">transformers_per_feature</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="summarize_feature_bounds_for_transformers-581"><a href="#summarize_feature_bounds_for_transformers-581"><span class="linenos">581</span></a>            <span class="k">for</span> <span class="n">transformer_struct</span> <span class="ow">in</span> <span class="n">v</span><span class="p">:</span>
-</span><span id="summarize_feature_bounds_for_transformers-582"><a href="#summarize_feature_bounds_for_transformers-582"><span class="linenos">582</span></a>                <span class="n">binner_templates</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">transformer_struct</span><span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-583"><a href="#summarize_feature_bounds_for_transformers-583"><span class="linenos">583</span></a>
-</span><span id="summarize_feature_bounds_for_transformers-584"><a href="#summarize_feature_bounds_for_transformers-584"><span class="linenos">584</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="summarize_feature_bounds_for_transformers-585"><a href="#summarize_feature_bounds_for_transformers-585"><span class="linenos">585</span></a>            <span class="sa">f</span><span class="s1">&#39;Generated </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">binner_templates</span><span class="p">)</span><span class="si">}</span><span class="s1"> transformation search specifications.</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="summarize_feature_bounds_for_transformers-586"><a href="#summarize_feature_bounds_for_transformers-586"><span class="linenos">586</span></a>        <span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-587"><a href="#summarize_feature_bounds_for_transformers-587"><span class="linenos">587</span></a>        <span class="n">namespace_full</span> <span class="o">=</span> <span class="sa">f</span><span class="s1">&#39;&quot;random_grid_feature_transform&quot;: </span><span class="si">{</span><span class="n">json</span><span class="o">.</span><span class="n">dumps</span><span class="p">(</span><span class="n">binner_templates</span><span class="p">)</span><span class="si">}</span><span class="s1">, &quot;random_grid_epochs&quot;: 512&#39;</span>
-</span><span id="summarize_feature_bounds_for_transformers-588"><a href="#summarize_feature_bounds_for_transformers-588"><span class="linenos">588</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Generated transformations below:</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="summarize_feature_bounds_for_transformers-589"><a href="#summarize_feature_bounds_for_transformers-589"><span class="linenos">589</span></a>        <span class="nb">print</span><span class="p">(</span><span class="n">namespace_full</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-578"><a href="#summarize_feature_bounds_for_transformers-578"><span class="linenos">578</span></a>                    <span class="n">transformers_per_feature</span><span class="p">[</span><span class="n">row</span><span class="o">.</span><span class="n">Feature</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
+</span><span id="summarize_feature_bounds_for_transformers-579"><a href="#summarize_feature_bounds_for_transformers-579"><span class="linenos">579</span></a>                        <span class="n">binner_pair_template_second</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-580"><a href="#summarize_feature_bounds_for_transformers-580"><span class="linenos">580</span></a>                    <span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-581"><a href="#summarize_feature_bounds_for_transformers-581"><span class="linenos">581</span></a>
+</span><span id="summarize_feature_bounds_for_transformers-582"><a href="#summarize_feature_bounds_for_transformers-582"><span class="linenos">582</span></a>        <span class="n">binner_templates</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="summarize_feature_bounds_for_transformers-583"><a href="#summarize_feature_bounds_for_transformers-583"><span class="linenos">583</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">transformers_per_feature</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="summarize_feature_bounds_for_transformers-584"><a href="#summarize_feature_bounds_for_transformers-584"><span class="linenos">584</span></a>            <span class="k">for</span> <span class="n">transformer_struct</span> <span class="ow">in</span> <span class="n">v</span><span class="p">:</span>
+</span><span id="summarize_feature_bounds_for_transformers-585"><a href="#summarize_feature_bounds_for_transformers-585"><span class="linenos">585</span></a>                <span class="n">binner_templates</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">transformer_struct</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-586"><a href="#summarize_feature_bounds_for_transformers-586"><span class="linenos">586</span></a>
+</span><span id="summarize_feature_bounds_for_transformers-587"><a href="#summarize_feature_bounds_for_transformers-587"><span class="linenos">587</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="summarize_feature_bounds_for_transformers-588"><a href="#summarize_feature_bounds_for_transformers-588"><span class="linenos">588</span></a>            <span class="sa">f</span><span class="s1">&#39;Generated </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">binner_templates</span><span class="p">)</span><span class="si">}</span><span class="s1"> transformation search specifications.</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="summarize_feature_bounds_for_transformers-589"><a href="#summarize_feature_bounds_for_transformers-589"><span class="linenos">589</span></a>        <span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-590"><a href="#summarize_feature_bounds_for_transformers-590"><span class="linenos">590</span></a>        <span class="n">namespace_full</span> <span class="o">=</span> <span class="sa">f</span><span class="s1">&#39;&quot;random_grid_feature_transform&quot;: </span><span class="si">{</span><span class="n">json</span><span class="o">.</span><span class="n">dumps</span><span class="p">(</span><span class="n">binner_templates</span><span class="p">)</span><span class="si">}</span><span class="s1">, &quot;random_grid_epochs&quot;: 512&#39;</span>
+</span><span id="summarize_feature_bounds_for_transformers-591"><a href="#summarize_feature_bounds_for_transformers-591"><span class="linenos">591</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;Generated transformations below:</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="summarize_feature_bounds_for_transformers-592"><a href="#summarize_feature_bounds_for_transformers-592"><span class="linenos">592</span></a>        <span class="nb">print</span><span class="p">(</span><span class="n">namespace_full</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -2000,7 +2033,7 @@ <h1 class="modulename">
                 <section id="summarize_rare_counts">
                             <input id="summarize_rare_counts-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">summarize_rare_counts</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">term_counter</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">args</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">cardinality_object</span><span class="p">:</span> <span class="n">Any</span>,</span><span class="param">	<span class="n">object_info</span><span class="p">:</span> <span class="n"><a href="#DatasetInformationStorage">DatasetInformationStorage</a></span></span><span class="return-annotation">) -> <span class="kc">None</span>:</span></span>
 
@@ -2008,59 +2041,59 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#summarize_rare_counts"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="summarize_rare_counts-592"><a href="#summarize_rare_counts-592"><span class="linenos">592</span></a><span class="k">def</span> <span class="nf">summarize_rare_counts</span><span class="p">(</span>
-</span><span id="summarize_rare_counts-593"><a href="#summarize_rare_counts-593"><span class="linenos">593</span></a>    <span class="n">term_counter</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="summarize_rare_counts-594"><a href="#summarize_rare_counts-594"><span class="linenos">594</span></a>    <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="summarize_rare_counts-595"><a href="#summarize_rare_counts-595"><span class="linenos">595</span></a>    <span class="n">cardinality_object</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
-</span><span id="summarize_rare_counts-596"><a href="#summarize_rare_counts-596"><span class="linenos">596</span></a>    <span class="n">object_info</span><span class="p">:</span> <span class="n">DatasetInformationStorage</span><span class="p">,</span>
-</span><span id="summarize_rare_counts-597"><a href="#summarize_rare_counts-597"><span class="linenos">597</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="summarize_rare_counts-598"><a href="#summarize_rare_counts-598"><span class="linenos">598</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Write rare values&quot;&quot;&quot;</span>
-</span><span id="summarize_rare_counts-599"><a href="#summarize_rare_counts-599"><span class="linenos">599</span></a>
-</span><span id="summarize_rare_counts-600"><a href="#summarize_rare_counts-600"><span class="linenos">600</span></a>    <span class="n">out_df_rows</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="summarize_rare_counts-601"><a href="#summarize_rare_counts-601"><span class="linenos">601</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="summarize_rare_counts-602"><a href="#summarize_rare_counts-602"><span class="linenos">602</span></a>        <span class="sa">f</span><span class="s1">&#39;Rare value summary (freq &lt;= </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">rare_value_count_upper_bound</span><span class="si">}</span><span class="s1">) follows ..&#39;</span><span class="p">,</span>
-</span><span id="summarize_rare_counts-603"><a href="#summarize_rare_counts-603"><span class="linenos">603</span></a>    <span class="p">)</span>
-</span><span id="summarize_rare_counts-604"><a href="#summarize_rare_counts-604"><span class="linenos">604</span></a>
-</span><span id="summarize_rare_counts-605"><a href="#summarize_rare_counts-605"><span class="linenos">605</span></a>    <span class="k">for</span> <span class="n">namespace_tuple</span><span class="p">,</span> <span class="n">count</span> <span class="ow">in</span> <span class="n">term_counter</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="summarize_rare_counts-606"><a href="#summarize_rare_counts-606"><span class="linenos">606</span></a>        <span class="n">namespace</span><span class="p">,</span> <span class="n">value</span> <span class="o">=</span> <span class="n">namespace_tuple</span>
-</span><span id="summarize_rare_counts-607"><a href="#summarize_rare_counts-607"><span class="linenos">607</span></a>        <span class="n">out_df_rows</span><span class="o">.</span><span class="n">append</span><span class="p">([</span><span class="n">namespace</span><span class="p">,</span> <span class="n">value</span><span class="p">,</span> <span class="n">count</span><span class="p">])</span>
-</span><span id="summarize_rare_counts-608"><a href="#summarize_rare_counts-608"><span class="linenos">608</span></a>    <span class="n">out_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">out_df_rows</span><span class="p">)</span>
-</span><span id="summarize_rare_counts-609"><a href="#summarize_rare_counts-609"><span class="linenos">609</span></a>    <span class="n">out_df</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;Namespace&#39;</span><span class="p">,</span> <span class="s1">&#39;value&#39;</span><span class="p">,</span> <span class="s1">&#39;Count&#39;</span><span class="p">]</span>
-</span><span id="summarize_rare_counts-610"><a href="#summarize_rare_counts-610"><span class="linenos">610</span></a>    <span class="n">out_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span>
-</span><span id="summarize_rare_counts-611"><a href="#summarize_rare_counts-611"><span class="linenos">611</span></a>        <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="p">,</span> <span class="s1">&#39;rare_values.tsv&#39;</span><span class="p">),</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span> <span class="n">index</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-</span><span id="summarize_rare_counts-612"><a href="#summarize_rare_counts-612"><span class="linenos">612</span></a>    <span class="p">)</span>
-</span><span id="summarize_rare_counts-613"><a href="#summarize_rare_counts-613"><span class="linenos">613</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Wrote rare values to </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="si">}</span><span class="s1">/rare_values.tsv&#39;</span><span class="p">)</span>
-</span><span id="summarize_rare_counts-614"><a href="#summarize_rare_counts-614"><span class="linenos">614</span></a>
-</span><span id="summarize_rare_counts-615"><a href="#summarize_rare_counts-615"><span class="linenos">615</span></a>    <span class="n">overall_rare_counts</span> <span class="o">=</span> <span class="n">Counter</span><span class="p">(</span><span class="n">out_df</span><span class="o">.</span><span class="n">Namespace</span><span class="o">.</span><span class="n">values</span><span class="p">)</span>
-</span><span id="summarize_rare_counts-616"><a href="#summarize_rare_counts-616"><span class="linenos">616</span></a>    <span class="n">sorted_counts</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span>
-</span><span id="summarize_rare_counts-617"><a href="#summarize_rare_counts-617"><span class="linenos">617</span></a>        <span class="n">overall_rare_counts</span><span class="o">.</span><span class="n">items</span><span class="p">(),</span> <span class="n">key</span><span class="o">=</span><span class="k">lambda</span> <span class="n">pair</span><span class="p">:</span> <span class="n">pair</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">reverse</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-</span><span id="summarize_rare_counts-618"><a href="#summarize_rare_counts-618"><span class="linenos">618</span></a>    <span class="p">)</span>
-</span><span id="summarize_rare_counts-619"><a href="#summarize_rare_counts-619"><span class="linenos">619</span></a>    <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">sorted_counts</span><span class="p">:</span>
-</span><span id="summarize_rare_counts-620"><a href="#summarize_rare_counts-620"><span class="linenos">620</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Namespace: </span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s1"> ---- Rare values observed: </span><span class="si">{</span><span class="n">v</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="summarize_rare_counts-621"><a href="#summarize_rare_counts-621"><span class="linenos">621</span></a>
-</span><span id="summarize_rare_counts-622"><a href="#summarize_rare_counts-622"><span class="linenos">622</span></a>    <span class="n">final_df_rows</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="summarize_rare_counts-623"><a href="#summarize_rare_counts-623"><span class="linenos">623</span></a>    <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">sorted_counts</span><span class="p">:</span>
-</span><span id="summarize_rare_counts-624"><a href="#summarize_rare_counts-624"><span class="linenos">624</span></a>        <span class="n">cardinality</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">cardinality_object</span><span class="p">[</span><span class="n">k</span><span class="p">])</span>
-</span><span id="summarize_rare_counts-625"><a href="#summarize_rare_counts-625"><span class="linenos">625</span></a>        <span class="n">rare_proportion</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">round</span><span class="p">(</span><span class="mi">100</span> <span class="o">*</span> <span class="p">(</span><span class="n">v</span> <span class="o">/</span> <span class="n">cardinality</span><span class="p">),</span> <span class="mi">2</span><span class="p">)</span>
-</span><span id="summarize_rare_counts-626"><a href="#summarize_rare_counts-626"><span class="linenos">626</span></a>        <span class="n">col_type</span> <span class="o">=</span> <span class="s1">&#39;nominal&#39;</span>
-</span><span id="summarize_rare_counts-627"><a href="#summarize_rare_counts-627"><span class="linenos">627</span></a>        <span class="k">if</span> <span class="n">k</span> <span class="ow">in</span> <span class="n">object_info</span><span class="o">.</span><span class="n">column_types</span><span class="p">:</span>
-</span><span id="summarize_rare_counts-628"><a href="#summarize_rare_counts-628"><span class="linenos">628</span></a>            <span class="n">col_type</span> <span class="o">=</span> <span class="s1">&#39;numeric&#39;</span>
-</span><span id="summarize_rare_counts-629"><a href="#summarize_rare_counts-629"><span class="linenos">629</span></a>        <span class="n">final_df_rows</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-</span><span id="summarize_rare_counts-630"><a href="#summarize_rare_counts-630"><span class="linenos">630</span></a>            <span class="p">{</span>
-</span><span id="summarize_rare_counts-631"><a href="#summarize_rare_counts-631"><span class="linenos">631</span></a>                <span class="s1">&#39;rare_proportion&#39;</span><span class="p">:</span> <span class="n">rare_proportion</span><span class="p">,</span>
-</span><span id="summarize_rare_counts-632"><a href="#summarize_rare_counts-632"><span class="linenos">632</span></a>                <span class="s1">&#39;feature_type&#39;</span><span class="p">:</span> <span class="n">col_type</span><span class="p">,</span>
-</span><span id="summarize_rare_counts-633"><a href="#summarize_rare_counts-633"><span class="linenos">633</span></a>                <span class="s1">&#39;feature_name&#39;</span><span class="p">:</span> <span class="n">k</span><span class="p">,</span>
-</span><span id="summarize_rare_counts-634"><a href="#summarize_rare_counts-634"><span class="linenos">634</span></a>            <span class="p">},</span>
-</span><span id="summarize_rare_counts-635"><a href="#summarize_rare_counts-635"><span class="linenos">635</span></a>        <span class="p">)</span>
-</span><span id="summarize_rare_counts-636"><a href="#summarize_rare_counts-636"><span class="linenos">636</span></a>
-</span><span id="summarize_rare_counts-637"><a href="#summarize_rare_counts-637"><span class="linenos">637</span></a>    <span class="n">final_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">final_df_rows</span><span class="p">)</span>
-</span><span id="summarize_rare_counts-638"><a href="#summarize_rare_counts-638"><span class="linenos">638</span></a>    <span class="n">final_df</span> <span class="o">=</span> <span class="n">final_df</span><span class="o">.</span><span class="n">sort_values</span><span class="p">(</span><span class="n">by</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;rare_proportion&#39;</span><span class="p">])</span>
-</span><span id="summarize_rare_counts-639"><a href="#summarize_rare_counts-639"><span class="linenos">639</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="summarize_rare_counts-640"><a href="#summarize_rare_counts-640"><span class="linenos">640</span></a>        <span class="sa">f</span><span class="s1">&#39;Wrote feature sparsity summary to </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="si">}</span><span class="s1">/feature_sparsity_summary.tsv&#39;</span><span class="p">,</span>
-</span><span id="summarize_rare_counts-641"><a href="#summarize_rare_counts-641"><span class="linenos">641</span></a>    <span class="p">)</span>
-</span><span id="summarize_rare_counts-642"><a href="#summarize_rare_counts-642"><span class="linenos">642</span></a>    <span class="n">final_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span>
-</span><span id="summarize_rare_counts-643"><a href="#summarize_rare_counts-643"><span class="linenos">643</span></a>        <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="si">}</span><span class="s1">/feature_sparsity_summary.tsv&#39;</span><span class="p">,</span> <span class="n">index</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="summarize_rare_counts-595"><a href="#summarize_rare_counts-595"><span class="linenos">595</span></a><span class="k">def</span> <span class="nf">summarize_rare_counts</span><span class="p">(</span>
+</span><span id="summarize_rare_counts-596"><a href="#summarize_rare_counts-596"><span class="linenos">596</span></a>    <span class="n">term_counter</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="summarize_rare_counts-597"><a href="#summarize_rare_counts-597"><span class="linenos">597</span></a>    <span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="summarize_rare_counts-598"><a href="#summarize_rare_counts-598"><span class="linenos">598</span></a>    <span class="n">cardinality_object</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="summarize_rare_counts-599"><a href="#summarize_rare_counts-599"><span class="linenos">599</span></a>    <span class="n">object_info</span><span class="p">:</span> <span class="n">DatasetInformationStorage</span><span class="p">,</span>
+</span><span id="summarize_rare_counts-600"><a href="#summarize_rare_counts-600"><span class="linenos">600</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="summarize_rare_counts-601"><a href="#summarize_rare_counts-601"><span class="linenos">601</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Write rare values&quot;&quot;&quot;</span>
+</span><span id="summarize_rare_counts-602"><a href="#summarize_rare_counts-602"><span class="linenos">602</span></a>
+</span><span id="summarize_rare_counts-603"><a href="#summarize_rare_counts-603"><span class="linenos">603</span></a>    <span class="n">out_df_rows</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="summarize_rare_counts-604"><a href="#summarize_rare_counts-604"><span class="linenos">604</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="summarize_rare_counts-605"><a href="#summarize_rare_counts-605"><span class="linenos">605</span></a>        <span class="sa">f</span><span class="s1">&#39;Rare value summary (freq &lt;= </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">rare_value_count_upper_bound</span><span class="si">}</span><span class="s1">) follows ..&#39;</span><span class="p">,</span>
+</span><span id="summarize_rare_counts-606"><a href="#summarize_rare_counts-606"><span class="linenos">606</span></a>    <span class="p">)</span>
+</span><span id="summarize_rare_counts-607"><a href="#summarize_rare_counts-607"><span class="linenos">607</span></a>
+</span><span id="summarize_rare_counts-608"><a href="#summarize_rare_counts-608"><span class="linenos">608</span></a>    <span class="k">for</span> <span class="n">namespace_tuple</span><span class="p">,</span> <span class="n">count</span> <span class="ow">in</span> <span class="n">term_counter</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="summarize_rare_counts-609"><a href="#summarize_rare_counts-609"><span class="linenos">609</span></a>        <span class="n">namespace</span><span class="p">,</span> <span class="n">value</span> <span class="o">=</span> <span class="n">namespace_tuple</span>
+</span><span id="summarize_rare_counts-610"><a href="#summarize_rare_counts-610"><span class="linenos">610</span></a>        <span class="n">out_df_rows</span><span class="o">.</span><span class="n">append</span><span class="p">([</span><span class="n">namespace</span><span class="p">,</span> <span class="n">value</span><span class="p">,</span> <span class="n">count</span><span class="p">])</span>
+</span><span id="summarize_rare_counts-611"><a href="#summarize_rare_counts-611"><span class="linenos">611</span></a>    <span class="n">out_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">out_df_rows</span><span class="p">)</span>
+</span><span id="summarize_rare_counts-612"><a href="#summarize_rare_counts-612"><span class="linenos">612</span></a>    <span class="n">out_df</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;Namespace&#39;</span><span class="p">,</span> <span class="s1">&#39;value&#39;</span><span class="p">,</span> <span class="s1">&#39;Count&#39;</span><span class="p">]</span>
+</span><span id="summarize_rare_counts-613"><a href="#summarize_rare_counts-613"><span class="linenos">613</span></a>    <span class="n">out_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span>
+</span><span id="summarize_rare_counts-614"><a href="#summarize_rare_counts-614"><span class="linenos">614</span></a>        <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="p">,</span> <span class="s1">&#39;rare_values.tsv&#39;</span><span class="p">),</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span> <span class="n">index</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+</span><span id="summarize_rare_counts-615"><a href="#summarize_rare_counts-615"><span class="linenos">615</span></a>    <span class="p">)</span>
+</span><span id="summarize_rare_counts-616"><a href="#summarize_rare_counts-616"><span class="linenos">616</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Wrote rare values to </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="si">}</span><span class="s1">/rare_values.tsv&#39;</span><span class="p">)</span>
+</span><span id="summarize_rare_counts-617"><a href="#summarize_rare_counts-617"><span class="linenos">617</span></a>
+</span><span id="summarize_rare_counts-618"><a href="#summarize_rare_counts-618"><span class="linenos">618</span></a>    <span class="n">overall_rare_counts</span> <span class="o">=</span> <span class="n">Counter</span><span class="p">(</span><span class="n">out_df</span><span class="o">.</span><span class="n">Namespace</span><span class="o">.</span><span class="n">values</span><span class="p">)</span>
+</span><span id="summarize_rare_counts-619"><a href="#summarize_rare_counts-619"><span class="linenos">619</span></a>    <span class="n">sorted_counts</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span>
+</span><span id="summarize_rare_counts-620"><a href="#summarize_rare_counts-620"><span class="linenos">620</span></a>        <span class="n">overall_rare_counts</span><span class="o">.</span><span class="n">items</span><span class="p">(),</span> <span class="n">key</span><span class="o">=</span><span class="k">lambda</span> <span class="n">pair</span><span class="p">:</span> <span class="n">pair</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">reverse</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+</span><span id="summarize_rare_counts-621"><a href="#summarize_rare_counts-621"><span class="linenos">621</span></a>    <span class="p">)</span>
+</span><span id="summarize_rare_counts-622"><a href="#summarize_rare_counts-622"><span class="linenos">622</span></a>    <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">sorted_counts</span><span class="p">:</span>
+</span><span id="summarize_rare_counts-623"><a href="#summarize_rare_counts-623"><span class="linenos">623</span></a>        <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Namespace: </span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s1"> ---- Rare values observed: </span><span class="si">{</span><span class="n">v</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="summarize_rare_counts-624"><a href="#summarize_rare_counts-624"><span class="linenos">624</span></a>
+</span><span id="summarize_rare_counts-625"><a href="#summarize_rare_counts-625"><span class="linenos">625</span></a>    <span class="n">final_df_rows</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="summarize_rare_counts-626"><a href="#summarize_rare_counts-626"><span class="linenos">626</span></a>    <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">sorted_counts</span><span class="p">:</span>
+</span><span id="summarize_rare_counts-627"><a href="#summarize_rare_counts-627"><span class="linenos">627</span></a>        <span class="n">cardinality</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">cardinality_object</span><span class="p">[</span><span class="n">k</span><span class="p">])</span>
+</span><span id="summarize_rare_counts-628"><a href="#summarize_rare_counts-628"><span class="linenos">628</span></a>        <span class="n">rare_proportion</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">round</span><span class="p">(</span><span class="mi">100</span> <span class="o">*</span> <span class="p">(</span><span class="n">v</span> <span class="o">/</span> <span class="n">cardinality</span><span class="p">),</span> <span class="mi">2</span><span class="p">)</span>
+</span><span id="summarize_rare_counts-629"><a href="#summarize_rare_counts-629"><span class="linenos">629</span></a>        <span class="n">col_type</span> <span class="o">=</span> <span class="s1">&#39;nominal&#39;</span>
+</span><span id="summarize_rare_counts-630"><a href="#summarize_rare_counts-630"><span class="linenos">630</span></a>        <span class="k">if</span> <span class="n">k</span> <span class="ow">in</span> <span class="n">object_info</span><span class="o">.</span><span class="n">column_types</span><span class="p">:</span>
+</span><span id="summarize_rare_counts-631"><a href="#summarize_rare_counts-631"><span class="linenos">631</span></a>            <span class="n">col_type</span> <span class="o">=</span> <span class="s1">&#39;numeric&#39;</span>
+</span><span id="summarize_rare_counts-632"><a href="#summarize_rare_counts-632"><span class="linenos">632</span></a>        <span class="n">final_df_rows</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
+</span><span id="summarize_rare_counts-633"><a href="#summarize_rare_counts-633"><span class="linenos">633</span></a>            <span class="p">{</span>
+</span><span id="summarize_rare_counts-634"><a href="#summarize_rare_counts-634"><span class="linenos">634</span></a>                <span class="s1">&#39;rare_proportion&#39;</span><span class="p">:</span> <span class="n">rare_proportion</span><span class="p">,</span>
+</span><span id="summarize_rare_counts-635"><a href="#summarize_rare_counts-635"><span class="linenos">635</span></a>                <span class="s1">&#39;feature_type&#39;</span><span class="p">:</span> <span class="n">col_type</span><span class="p">,</span>
+</span><span id="summarize_rare_counts-636"><a href="#summarize_rare_counts-636"><span class="linenos">636</span></a>                <span class="s1">&#39;feature_name&#39;</span><span class="p">:</span> <span class="n">k</span><span class="p">,</span>
+</span><span id="summarize_rare_counts-637"><a href="#summarize_rare_counts-637"><span class="linenos">637</span></a>            <span class="p">},</span>
+</span><span id="summarize_rare_counts-638"><a href="#summarize_rare_counts-638"><span class="linenos">638</span></a>        <span class="p">)</span>
+</span><span id="summarize_rare_counts-639"><a href="#summarize_rare_counts-639"><span class="linenos">639</span></a>
+</span><span id="summarize_rare_counts-640"><a href="#summarize_rare_counts-640"><span class="linenos">640</span></a>    <span class="n">final_df</span><span class="p">:</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">final_df_rows</span><span class="p">)</span>
+</span><span id="summarize_rare_counts-641"><a href="#summarize_rare_counts-641"><span class="linenos">641</span></a>    <span class="n">final_df</span> <span class="o">=</span> <span class="n">final_df</span><span class="o">.</span><span class="n">sort_values</span><span class="p">(</span><span class="n">by</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;rare_proportion&#39;</span><span class="p">])</span>
+</span><span id="summarize_rare_counts-642"><a href="#summarize_rare_counts-642"><span class="linenos">642</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="summarize_rare_counts-643"><a href="#summarize_rare_counts-643"><span class="linenos">643</span></a>        <span class="sa">f</span><span class="s1">&#39;Wrote feature sparsity summary to </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="si">}</span><span class="s1">/feature_sparsity_summary.tsv&#39;</span><span class="p">,</span>
 </span><span id="summarize_rare_counts-644"><a href="#summarize_rare_counts-644"><span class="linenos">644</span></a>    <span class="p">)</span>
+</span><span id="summarize_rare_counts-645"><a href="#summarize_rare_counts-645"><span class="linenos">645</span></a>    <span class="n">final_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span>
+</span><span id="summarize_rare_counts-646"><a href="#summarize_rare_counts-646"><span class="linenos">646</span></a>        <span class="sa">f</span><span class="s1">&#39;</span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="si">}</span><span class="s1">/feature_sparsity_summary.tsv&#39;</span><span class="p">,</span> <span class="n">index</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="summarize_rare_counts-647"><a href="#summarize_rare_counts-647"><span class="linenos">647</span></a>    <span class="p">)</span>
 </span></pre></div>
 
 
@@ -2068,6 +2101,59 @@ <h1 class="modulename">
 </div>
 
 
+                </section>
+                <section id="is_prior_heuristic">
+                            <input id="is_prior_heuristic-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">is_prior_heuristic</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">args</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="nb">bool</span>:</span></span>
+
+                <label class="view-source-button" for="is_prior_heuristic-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#is_prior_heuristic"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="is_prior_heuristic-650"><a href="#is_prior_heuristic-650"><span class="linenos">650</span></a><span class="k">def</span> <span class="nf">is_prior_heuristic</span><span class="p">(</span><span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">bool</span><span class="p">:</span>
+</span><span id="is_prior_heuristic-651"><a href="#is_prior_heuristic-651"><span class="linenos">651</span></a>    <span class="k">if</span> <span class="s1">&#39;-prior&#39;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span> <span class="ow">and</span> <span class="n">args</span><span class="o">.</span><span class="n">reference_model_JSON</span><span class="p">:</span>
+</span><span id="is_prior_heuristic-652"><a href="#is_prior_heuristic-652"><span class="linenos">652</span></a>        <span class="k">return</span> <span class="kc">True</span>
+</span><span id="is_prior_heuristic-653"><a href="#is_prior_heuristic-653"><span class="linenos">653</span></a>    <span class="k">return</span> <span class="kc">False</span>
+</span></pre></div>
+
+
+    
+
+                </section>
+                <section id="get_num_of_instances">
+                            <input id="get_num_of_instances-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">get_num_of_instances</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">fname</span><span class="p">:</span> <span class="nb">str</span></span><span class="return-annotation">) -> <span class="nb">int</span>:</span></span>
+
+                <label class="view-source-button" for="get_num_of_instances-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#get_num_of_instances"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="get_num_of_instances-656"><a href="#get_num_of_instances-656"><span class="linenos">656</span></a><span class="k">def</span> <span class="nf">get_num_of_instances</span><span class="p">(</span><span class="n">fname</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="get_num_of_instances-657"><a href="#get_num_of_instances-657"><span class="linenos">657</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Count the number of lines in a file, fast - useful for progress logging&quot;&quot;&quot;</span>
+</span><span id="get_num_of_instances-658"><a href="#get_num_of_instances-658"><span class="linenos">658</span></a>
+</span><span id="get_num_of_instances-659"><a href="#get_num_of_instances-659"><span class="linenos">659</span></a>    <span class="k">def</span> <span class="nf">_make_gen</span><span class="p">(</span><span class="n">reader</span><span class="p">):</span>
+</span><span id="get_num_of_instances-660"><a href="#get_num_of_instances-660"><span class="linenos">660</span></a>        <span class="k">while</span> <span class="kc">True</span><span class="p">:</span>
+</span><span id="get_num_of_instances-661"><a href="#get_num_of_instances-661"><span class="linenos">661</span></a>            <span class="n">b</span> <span class="o">=</span> <span class="n">reader</span><span class="p">(</span><span class="mi">2</span><span class="o">**</span><span class="mi">16</span><span class="p">)</span>
+</span><span id="get_num_of_instances-662"><a href="#get_num_of_instances-662"><span class="linenos">662</span></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">b</span><span class="p">:</span>
+</span><span id="get_num_of_instances-663"><a href="#get_num_of_instances-663"><span class="linenos">663</span></a>                <span class="k">break</span>
+</span><span id="get_num_of_instances-664"><a href="#get_num_of_instances-664"><span class="linenos">664</span></a>            <span class="k">yield</span> <span class="n">b</span>
+</span><span id="get_num_of_instances-665"><a href="#get_num_of_instances-665"><span class="linenos">665</span></a>
+</span><span id="get_num_of_instances-666"><a href="#get_num_of_instances-666"><span class="linenos">666</span></a>    <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">fname</span><span class="p">,</span> <span class="s1">&#39;rb&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">f</span><span class="p">:</span>
+</span><span id="get_num_of_instances-667"><a href="#get_num_of_instances-667"><span class="linenos">667</span></a>        <span class="n">count</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">(</span><span class="n">buf</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="sa">b</span><span class="s1">&#39;</span><span class="se">\n</span><span class="s1">&#39;</span><span class="p">)</span> <span class="k">for</span> <span class="n">buf</span> <span class="ow">in</span> <span class="n">_make_gen</span><span class="p">(</span><span class="n">f</span><span class="o">.</span><span class="n">raw</span><span class="o">.</span><span class="n">read</span><span class="p">))</span>
+</span><span id="get_num_of_instances-668"><a href="#get_num_of_instances-668"><span class="linenos">668</span></a>    <span class="k">return</span> <span class="n">count</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Count the number of lines in a file, fast - useful for progress logging</p>
+</div>
+
+
                 </section>
     </main>
 <script>
@@ -2252,4 +2338,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/feature_transformations.html b/docs/outrank/feature_transformations.html
index 77c10c6..c84e722 100644
--- a/docs/outrank/feature_transformations.html
+++ b/docs/outrank/feature_transformations.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.feature_transformations API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -47,10 +47,10 @@ <h2>Submodules</h2>
                     <h1 class="modulename">
 <a href="./../outrank.html">outrank</a><wbr>.feature_transformations    </h1>
 
-
-
-
-
+                
+                
+                
+                
             </section>
     </main>
 <script>
@@ -235,4 +235,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/feature_transformations/feature_transformer_vault.html b/docs/outrank/feature_transformations/feature_transformer_vault.html
index 3219c64..fbd2281 100644
--- a/docs/outrank/feature_transformations/feature_transformer_vault.html
+++ b/docs/outrank/feature_transformations/feature_transformer_vault.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.feature_transformations.feature_transformer_vault API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -51,7 +51,7 @@ <h2>API Documentation</h2>
                     <h1 class="modulename">
 <a href="./../../outrank.html">outrank</a><wbr>.<a href="./../feature_transformations.html">feature_transformations</a><wbr>.feature_transformer_vault    </h1>
 
-
+                
                         <input id="mod-feature_transformer_vault-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 
                         <label class="view-source-button" for="mod-feature_transformer_vault-view-source"><span>View Source</span></label>
@@ -60,15 +60,14 @@ <h1 class="modulename">
 </span><span id="L-2"><a href="#L-2"><span class="linenos"> 2</span></a>
 </span><span id="L-3"><a href="#L-3"><span class="linenos"> 3</span></a><span class="kn">from</span> <span class="nn">outrank.feature_transformations.feature_transformer_vault.default_transformers</span> <span class="kn">import</span> <span class="n">DEFAULT_TRANSFORMERS</span>
 </span><span id="L-4"><a href="#L-4"><span class="linenos"> 4</span></a><span class="kn">from</span> <span class="nn">outrank.feature_transformations.feature_transformer_vault.default_transformers</span> <span class="kn">import</span> <span class="n">MINIMAL_TRANSFORMERS</span>
-</span><span id="L-5"><a href="#L-5"><span class="linenos"> 5</span></a><span class="kn">from</span> <span class="nn">outrank.feature_transformations.feature_transformer_vault.fw_transformers</span> <span class="kn">import</span> <span class="p">(</span>
-</span><span id="L-6"><a href="#L-6"><span class="linenos"> 6</span></a>    <span class="n">FW_TRANSFORMERS</span><span class="p">,</span>
-</span><span id="L-7"><a href="#L-7"><span class="linenos"> 7</span></a><span class="p">)</span>
-</span><span id="L-8"><a href="#L-8"><span class="linenos"> 8</span></a>
-</span><span id="L-9"><a href="#L-9"><span class="linenos"> 9</span></a><span class="n">_tr_global_namespace</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="L-10"><a href="#L-10"><span class="linenos">10</span></a>    <span class="s1">&#39;default&#39;</span><span class="p">:</span> <span class="n">DEFAULT_TRANSFORMERS</span><span class="p">,</span>
-</span><span id="L-11"><a href="#L-11"><span class="linenos">11</span></a>    <span class="s1">&#39;minimal&#39;</span><span class="p">:</span> <span class="n">MINIMAL_TRANSFORMERS</span><span class="p">,</span>
-</span><span id="L-12"><a href="#L-12"><span class="linenos">12</span></a>    <span class="s1">&#39;fw-transformers&#39;</span><span class="p">:</span> <span class="n">FW_TRANSFORMERS</span><span class="p">,</span>
-</span><span id="L-13"><a href="#L-13"><span class="linenos">13</span></a><span class="p">}</span>
+</span><span id="L-5"><a href="#L-5"><span class="linenos"> 5</span></a><span class="kn">from</span> <span class="nn">outrank.feature_transformations.feature_transformer_vault.fw_transformers</span> <span class="kn">import</span> \
+</span><span id="L-6"><a href="#L-6"><span class="linenos"> 6</span></a>    <span class="n">FW_TRANSFORMERS</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos"> 7</span></a>
+</span><span id="L-8"><a href="#L-8"><span class="linenos"> 8</span></a><span class="n">_tr_global_namespace</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-9"><a href="#L-9"><span class="linenos"> 9</span></a>    <span class="s1">&#39;default&#39;</span><span class="p">:</span> <span class="n">DEFAULT_TRANSFORMERS</span><span class="p">,</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos">10</span></a>    <span class="s1">&#39;minimal&#39;</span><span class="p">:</span> <span class="n">MINIMAL_TRANSFORMERS</span><span class="p">,</span>
+</span><span id="L-11"><a href="#L-11"><span class="linenos">11</span></a>    <span class="s1">&#39;fw-transformers&#39;</span><span class="p">:</span> <span class="n">FW_TRANSFORMERS</span><span class="p">,</span>
+</span><span id="L-12"><a href="#L-12"><span class="linenos">12</span></a><span class="p">}</span>
 </span></pre></div>
 
 
@@ -256,4 +255,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/feature_transformations/feature_transformer_vault/default_transformers.html b/docs/outrank/feature_transformations/feature_transformer_vault/default_transformers.html
index e9db800..c3fa662 100644
--- a/docs/outrank/feature_transformations/feature_transformer_vault/default_transformers.html
+++ b/docs/outrank/feature_transformations/feature_transformer_vault/default_transformers.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.feature_transformations.feature_transformer_vault.default_transformers API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -52,50 +52,51 @@ <h2>API Documentation</h2>
                     <h1 class="modulename">
 <a href="./../../../outrank.html">outrank</a><wbr>.<a href="./../../feature_transformations.html">feature_transformations</a><wbr>.<a href="./../feature_transformer_vault.html">feature_transformer_vault</a><wbr>.default_transformers    </h1>
 
-
+                
                         <input id="mod-default_transformers-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 
                         <label class="view-source-button" for="mod-default_transformers-view-source"><span>View Source</span></label>
 
                         <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos"> 1</span></a><span class="c1"># Some boilerplate transformations people tend to use</span>
 </span><span id="L-2"><a href="#L-2"><span class="linenos"> 2</span></a><span class="kn">from</span> <span class="nn">__future__</span> <span class="kn">import</span> <span class="n">annotations</span>
-</span><span id="L-3"><a href="#L-3"><span class="linenos"> 3</span></a><span class="n">MINIMAL_TRANSFORMERS</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="L-4"><a href="#L-4"><span class="linenos"> 4</span></a>    <span class="s1">&#39;_tr_sqrt&#39;</span><span class="p">:</span> <span class="s1">&#39;np.sqrt(X)&#39;</span><span class="p">,</span>
-</span><span id="L-5"><a href="#L-5"><span class="linenos"> 5</span></a>    <span class="s1">&#39;_tr_log(x+1)&#39;</span><span class="p">:</span> <span class="s1">&#39;np.log(X + 1)&#39;</span><span class="p">,</span>
-</span><span id="L-6"><a href="#L-6"><span class="linenos"> 6</span></a>    <span class="s1">&#39;_tr_sqrt(abs(x))&#39;</span><span class="p">:</span> <span class="s1">&#39;np.sqrt(np.abs(X))&#39;</span><span class="p">,</span>
-</span><span id="L-7"><a href="#L-7"><span class="linenos"> 7</span></a>    <span class="s1">&#39;_tr_log(abs(x)+1)&#39;</span><span class="p">:</span> <span class="s1">&#39;np.log(np.abs(X) + 1)&#39;</span><span class="p">,</span>
-</span><span id="L-8"><a href="#L-8"><span class="linenos"> 8</span></a><span class="p">}</span>
-</span><span id="L-9"><a href="#L-9"><span class="linenos"> 9</span></a>
-</span><span id="L-10"><a href="#L-10"><span class="linenos">10</span></a><span class="n">DEFAULT_TRANSFORMERS</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="L-11"><a href="#L-11"><span class="linenos">11</span></a>    <span class="s1">&#39;_tr_sqrt&#39;</span><span class="p">:</span> <span class="s1">&#39;np.sqrt(X)&#39;</span><span class="p">,</span>
-</span><span id="L-12"><a href="#L-12"><span class="linenos">12</span></a>    <span class="s1">&#39;_tr_log(x+1)&#39;</span><span class="p">:</span> <span class="s1">&#39;np.log(X + 1)&#39;</span><span class="p">,</span>
-</span><span id="L-13"><a href="#L-13"><span class="linenos">13</span></a>    <span class="s1">&#39;_tr_sqrt(abs(x))&#39;</span><span class="p">:</span> <span class="s1">&#39;np.sqrt(np.abs(X))&#39;</span><span class="p">,</span>
-</span><span id="L-14"><a href="#L-14"><span class="linenos">14</span></a>    <span class="s1">&#39;_tr_log(abs(x)+1)&#39;</span><span class="p">:</span> <span class="s1">&#39;np.log(np.abs(X) + 1)&#39;</span><span class="p">,</span>
-</span><span id="L-15"><a href="#L-15"><span class="linenos">15</span></a>    <span class="s1">&#39;_tr_div(x,abs(x))*log(abs(x))&#39;</span><span class="p">:</span> <span class="s1">&#39;np.divide(X, np.abs(X)) * np.log(np.abs(X))&#39;</span><span class="p">,</span>
-</span><span id="L-16"><a href="#L-16"><span class="linenos">16</span></a>    <span class="s1">&#39;_tr_log(x + sqrt(pow(x,2), 1)&#39;</span><span class="p">:</span> <span class="s1">&#39;np.log(X + np.sqrt(np.power(X, 2) + 1))&#39;</span><span class="p">,</span>
-</span><span id="L-17"><a href="#L-17"><span class="linenos">17</span></a>    <span class="s1">&#39;_tr_log*sqrt&#39;</span><span class="p">:</span> <span class="s1">&#39;np.log(X + 1) * np.sqrt(X)&#39;</span><span class="p">,</span>
-</span><span id="L-18"><a href="#L-18"><span class="linenos">18</span></a>    <span class="s1">&#39;_tr_log*100&#39;</span><span class="p">:</span> <span class="s1">&#39;np.round(np.log(X + 1) * 100, 0)&#39;</span><span class="p">,</span>
-</span><span id="L-19"><a href="#L-19"><span class="linenos">19</span></a>    <span class="s1">&#39;_tr_nonzero&#39;</span><span class="p">:</span> <span class="s1">&#39;np.where(X != 0, 1, 0)&#39;</span><span class="p">,</span>
-</span><span id="L-20"><a href="#L-20"><span class="linenos">20</span></a>    <span class="s1">&#39;_tr_round(div(x,max))&#39;</span><span class="p">:</span> <span class="s1">&#39;np.round(np.divide(X, np.max(X)), 0)&#39;</span><span class="p">,</span>
-</span><span id="L-21"><a href="#L-21"><span class="linenos">21</span></a><span class="p">}</span>
-</span><span id="L-22"><a href="#L-22"><span class="linenos">22</span></a>
-</span><span id="L-23"><a href="#L-23"><span class="linenos">23</span></a><span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s1">&#39;__main__&#39;</span><span class="p">:</span>
-</span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a>    <span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a>
-</span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a>    <span class="c1"># generate some input (call it X)</span>
-</span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a>    <span class="n">X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">random</span><span class="p">(</span><span class="mi">100</span><span class="p">)</span>
-</span><span id="L-28"><a href="#L-28"><span class="linenos">28</span></a>
-</span><span id="L-29"><a href="#L-29"><span class="linenos">29</span></a>    <span class="c1"># get some transformer</span>
-</span><span id="L-30"><a href="#L-30"><span class="linenos">30</span></a>    <span class="n">some_transformer</span> <span class="o">=</span> <span class="n">DEFAULT_TRANSFORMERS</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;_tr_nonzero&#39;</span><span class="p">)</span>
-</span><span id="L-31"><a href="#L-31"><span class="linenos">31</span></a>
-</span><span id="L-32"><a href="#L-32"><span class="linenos">32</span></a>    <span class="k">if</span> <span class="n">some_transformer</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-33"><a href="#L-33"><span class="linenos">33</span></a>        <span class="n">some_transformer</span> <span class="o">=</span> <span class="s1">&#39;&#39;</span>
-</span><span id="L-34"><a href="#L-34"><span class="linenos">34</span></a>
-</span><span id="L-35"><a href="#L-35"><span class="linenos">35</span></a>    <span class="c1"># evaluate to get output</span>
-</span><span id="L-36"><a href="#L-36"><span class="linenos">36</span></a>    <span class="n">output</span> <span class="o">=</span> <span class="nb">eval</span><span class="p">(</span><span class="n">some_transformer</span><span class="p">)</span>
-</span><span id="L-37"><a href="#L-37"><span class="linenos">37</span></a>
-</span><span id="L-38"><a href="#L-38"><span class="linenos">38</span></a>    <span class="c1"># check output somehow</span>
-</span><span id="L-39"><a href="#L-39"><span class="linenos">39</span></a>    <span class="nb">print</span><span class="p">(</span><span class="n">output</span><span class="p">)</span>
+</span><span id="L-3"><a href="#L-3"><span class="linenos"> 3</span></a>
+</span><span id="L-4"><a href="#L-4"><span class="linenos"> 4</span></a><span class="n">MINIMAL_TRANSFORMERS</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-5"><a href="#L-5"><span class="linenos"> 5</span></a>    <span class="s1">&#39;_tr_sqrt&#39;</span><span class="p">:</span> <span class="s1">&#39;np.sqrt(X)&#39;</span><span class="p">,</span>
+</span><span id="L-6"><a href="#L-6"><span class="linenos"> 6</span></a>    <span class="s1">&#39;_tr_log(x+1)&#39;</span><span class="p">:</span> <span class="s1">&#39;np.log(X + 1)&#39;</span><span class="p">,</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos"> 7</span></a>    <span class="s1">&#39;_tr_sqrt(abs(x))&#39;</span><span class="p">:</span> <span class="s1">&#39;np.sqrt(np.abs(X))&#39;</span><span class="p">,</span>
+</span><span id="L-8"><a href="#L-8"><span class="linenos"> 8</span></a>    <span class="s1">&#39;_tr_log(abs(x)+1)&#39;</span><span class="p">:</span> <span class="s1">&#39;np.log(np.abs(X) + 1)&#39;</span><span class="p">,</span>
+</span><span id="L-9"><a href="#L-9"><span class="linenos"> 9</span></a><span class="p">}</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos">10</span></a>
+</span><span id="L-11"><a href="#L-11"><span class="linenos">11</span></a><span class="n">DEFAULT_TRANSFORMERS</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-12"><a href="#L-12"><span class="linenos">12</span></a>    <span class="s1">&#39;_tr_sqrt&#39;</span><span class="p">:</span> <span class="s1">&#39;np.sqrt(X)&#39;</span><span class="p">,</span>
+</span><span id="L-13"><a href="#L-13"><span class="linenos">13</span></a>    <span class="s1">&#39;_tr_log(x+1)&#39;</span><span class="p">:</span> <span class="s1">&#39;np.log(X + 1)&#39;</span><span class="p">,</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos">14</span></a>    <span class="s1">&#39;_tr_sqrt(abs(x))&#39;</span><span class="p">:</span> <span class="s1">&#39;np.sqrt(np.abs(X))&#39;</span><span class="p">,</span>
+</span><span id="L-15"><a href="#L-15"><span class="linenos">15</span></a>    <span class="s1">&#39;_tr_log(abs(x)+1)&#39;</span><span class="p">:</span> <span class="s1">&#39;np.log(np.abs(X) + 1)&#39;</span><span class="p">,</span>
+</span><span id="L-16"><a href="#L-16"><span class="linenos">16</span></a>    <span class="s1">&#39;_tr_div(x,abs(x))*log(abs(x))&#39;</span><span class="p">:</span> <span class="s1">&#39;np.divide(X, np.abs(X)) * np.log(np.abs(X))&#39;</span><span class="p">,</span>
+</span><span id="L-17"><a href="#L-17"><span class="linenos">17</span></a>    <span class="s1">&#39;_tr_log(x + sqrt(pow(x,2), 1)&#39;</span><span class="p">:</span> <span class="s1">&#39;np.log(X + np.sqrt(np.power(X, 2) + 1))&#39;</span><span class="p">,</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos">18</span></a>    <span class="s1">&#39;_tr_log*sqrt&#39;</span><span class="p">:</span> <span class="s1">&#39;np.log(X + 1) * np.sqrt(X)&#39;</span><span class="p">,</span>
+</span><span id="L-19"><a href="#L-19"><span class="linenos">19</span></a>    <span class="s1">&#39;_tr_log*100&#39;</span><span class="p">:</span> <span class="s1">&#39;np.round(np.log(X + 1) * 100, 0)&#39;</span><span class="p">,</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos">20</span></a>    <span class="s1">&#39;_tr_nonzero&#39;</span><span class="p">:</span> <span class="s1">&#39;np.where(X != 0, 1, 0)&#39;</span><span class="p">,</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos">21</span></a>    <span class="s1">&#39;_tr_round(div(x,max))&#39;</span><span class="p">:</span> <span class="s1">&#39;np.round(np.divide(X, np.max(X)), 0)&#39;</span><span class="p">,</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos">22</span></a><span class="p">}</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos">23</span></a>
+</span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a><span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s1">&#39;__main__&#39;</span><span class="p">:</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a>    <span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a>
+</span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a>    <span class="c1"># generate some input (call it X)</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos">28</span></a>    <span class="n">X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">random</span><span class="p">(</span><span class="mi">100</span><span class="p">)</span>
+</span><span id="L-29"><a href="#L-29"><span class="linenos">29</span></a>
+</span><span id="L-30"><a href="#L-30"><span class="linenos">30</span></a>    <span class="c1"># get some transformer</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos">31</span></a>    <span class="n">some_transformer</span> <span class="o">=</span> <span class="n">DEFAULT_TRANSFORMERS</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;_tr_nonzero&#39;</span><span class="p">)</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos">32</span></a>
+</span><span id="L-33"><a href="#L-33"><span class="linenos">33</span></a>    <span class="k">if</span> <span class="n">some_transformer</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos">34</span></a>        <span class="n">some_transformer</span> <span class="o">=</span> <span class="s1">&#39;&#39;</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos">35</span></a>
+</span><span id="L-36"><a href="#L-36"><span class="linenos">36</span></a>    <span class="c1"># evaluate to get output</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos">37</span></a>    <span class="n">output</span> <span class="o">=</span> <span class="nb">eval</span><span class="p">(</span><span class="n">some_transformer</span><span class="p">)</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos">38</span></a>
+</span><span id="L-39"><a href="#L-39"><span class="linenos">39</span></a>    <span class="c1"># check output somehow</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos">40</span></a>    <span class="nb">print</span><span class="p">(</span><span class="n">output</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -106,11 +107,11 @@ <h1 class="modulename">
 <input id="MINIMAL_TRANSFORMERS-view-value" class="view-value-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
             <label class="view-value-button pdoc-button" for="MINIMAL_TRANSFORMERS-view-value"></label><span class="default_value">{&#39;_tr_sqrt&#39;: &#39;np.sqrt(X)&#39;, &#39;_tr_log(x+1)&#39;: &#39;np.log(X + 1)&#39;, &#39;_tr_sqrt(abs(x))&#39;: &#39;np.sqrt(np.abs(X))&#39;, &#39;_tr_log(abs(x)+1)&#39;: &#39;np.log(np.abs(X) + 1)&#39;}</span>
 
-
+        
     </div>
     <a class="headerlink" href="#MINIMAL_TRANSFORMERS"></a>
-
-
+    
+    
 
                 </section>
                 <section id="DEFAULT_TRANSFORMERS">
@@ -119,11 +120,11 @@ <h1 class="modulename">
 <input id="DEFAULT_TRANSFORMERS-view-value" class="view-value-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
             <label class="view-value-button pdoc-button" for="DEFAULT_TRANSFORMERS-view-value"></label><span class="default_value">{&#39;_tr_sqrt&#39;: &#39;np.sqrt(X)&#39;, &#39;_tr_log(x+1)&#39;: &#39;np.log(X + 1)&#39;, &#39;_tr_sqrt(abs(x))&#39;: &#39;np.sqrt(np.abs(X))&#39;, &#39;_tr_log(abs(x)+1)&#39;: &#39;np.log(np.abs(X) + 1)&#39;, &#39;_tr_div(x,abs(x))*log(abs(x))&#39;: &#39;np.divide(X, np.abs(X)) * np.log(np.abs(X))&#39;, &#39;_tr_log(x + sqrt(pow(x,2), 1)&#39;: &#39;np.log(X + np.sqrt(np.power(X, 2) + 1))&#39;, &#39;_tr_log*sqrt&#39;: &#39;np.log(X + 1) * np.sqrt(X)&#39;, &#39;_tr_log*100&#39;: &#39;np.round(np.log(X + 1) * 100, 0)&#39;, &#39;_tr_nonzero&#39;: &#39;np.where(X != 0, 1, 0)&#39;, &#39;_tr_round(div(x,max))&#39;: &#39;np.round(np.divide(X, np.max(X)), 0)&#39;}</span>
 
-
+        
     </div>
     <a class="headerlink" href="#DEFAULT_TRANSFORMERS"></a>
-
-
+    
+    
 
                 </section>
     </main>
@@ -309,4 +310,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/feature_transformations/feature_transformer_vault/fw_transformers.html b/docs/outrank/feature_transformations/feature_transformer_vault/fw_transformers.html
index a3e5a60..5e5b619 100644
--- a/docs/outrank/feature_transformations/feature_transformer_vault/fw_transformers.html
+++ b/docs/outrank/feature_transformations/feature_transformer_vault/fw_transformers.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.feature_transformations.feature_transformer_vault.fw_transformers API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -55,7 +55,7 @@ <h2>API Documentation</h2>
                     <h1 class="modulename">
 <a href="./../../../outrank.html">outrank</a><wbr>.<a href="./../../feature_transformations.html">feature_transformations</a><wbr>.<a href="./../feature_transformer_vault.html">feature_transformer_vault</a><wbr>.fw_transformers    </h1>
 
-
+                
                         <input id="mod-fw_transformers-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 
                         <label class="view-source-button" for="mod-fw_transformers-view-source"><span>View Source</span></label>
@@ -64,39 +64,38 @@ <h1 class="modulename">
 </span><span id="L-2"><a href="#L-2"><span class="linenos"> 2</span></a>
 </span><span id="L-3"><a href="#L-3"><span class="linenos"> 3</span></a><span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
 </span><span id="L-4"><a href="#L-4"><span class="linenos"> 4</span></a>
-</span><span id="L-5"><a href="#L-5"><span class="linenos"> 5</span></a><span class="kn">from</span> <span class="nn">outrank.feature_transformations.feature_transformer_vault.default_transformers</span> <span class="kn">import</span> <span class="p">(</span>
-</span><span id="L-6"><a href="#L-6"><span class="linenos"> 6</span></a>    <span class="n">DEFAULT_TRANSFORMERS</span><span class="p">,</span>
-</span><span id="L-7"><a href="#L-7"><span class="linenos"> 7</span></a><span class="p">)</span>
-</span><span id="L-8"><a href="#L-8"><span class="linenos"> 8</span></a>
-</span><span id="L-9"><a href="#L-9"><span class="linenos"> 9</span></a><span class="n">FW_TRANSFORMERS</span> <span class="o">=</span> <span class="n">DEFAULT_TRANSFORMERS</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="L-10"><a href="#L-10"><span class="linenos">10</span></a><span class="n">resolution_range</span> <span class="o">=</span> <span class="p">[</span><span class="mi">1</span><span class="p">,</span> <span class="mi">10</span><span class="p">,</span> <span class="mi">50</span><span class="p">,</span> <span class="mi">100</span><span class="p">]</span>
-</span><span id="L-11"><a href="#L-11"><span class="linenos">11</span></a><span class="n">greater_than_range</span> <span class="o">=</span> <span class="p">[</span><span class="mi">1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">8</span><span class="p">,</span> <span class="mi">16</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">64</span><span class="p">,</span> <span class="mi">96</span><span class="p">]</span>
-</span><span id="L-12"><a href="#L-12"><span class="linenos">12</span></a>
-</span><span id="L-13"><a href="#L-13"><span class="linenos">13</span></a><span class="k">for</span> <span class="n">resolution</span> <span class="ow">in</span> <span class="n">resolution_range</span><span class="p">:</span>
-</span><span id="L-14"><a href="#L-14"><span class="linenos">14</span></a>    <span class="k">for</span> <span class="n">greater_than</span> <span class="ow">in</span> <span class="n">greater_than_range</span><span class="p">:</span>
-</span><span id="L-15"><a href="#L-15"><span class="linenos">15</span></a>        <span class="n">FW_TRANSFORMERS</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;_tr_fw_sqrt_res_</span><span class="si">{</span><span class="n">resolution</span><span class="si">}</span><span class="s1">_gt_</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="L-16"><a href="#L-16"><span class="linenos">16</span></a>            <span class="sa">f</span><span class="s1">&#39;np.where(X &lt; </span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">, &#39;</span>
-</span><span id="L-17"><a href="#L-17"><span class="linenos">17</span></a>            <span class="sa">f</span><span class="s1">&#39;X, &#39;</span>
-</span><span id="L-18"><a href="#L-18"><span class="linenos">18</span></a>            <span class="sa">f</span><span class="s1">&#39;np.where(X&gt;</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1"> ,&#39;</span>
-</span><span id="L-19"><a href="#L-19"><span class="linenos">19</span></a>            <span class="sa">f</span><span class="s1">&#39;np.round(np.sqrt(X-</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">)*</span><span class="si">{</span><span class="n">resolution</span><span class="si">}</span><span class="s1">,0), 0))&#39;</span>
-</span><span id="L-20"><a href="#L-20"><span class="linenos">20</span></a>        <span class="p">)</span>
-</span><span id="L-21"><a href="#L-21"><span class="linenos">21</span></a>
-</span><span id="L-22"><a href="#L-22"><span class="linenos">22</span></a>        <span class="n">FW_TRANSFORMERS</span><span class="p">[</span>
-</span><span id="L-23"><a href="#L-23"><span class="linenos">23</span></a>            <span class="sa">f</span><span class="s1">&#39;_tr_fw_log_res_</span><span class="si">{</span><span class="n">resolution</span><span class="si">}</span><span class="s1">_gt_</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">&#39;</span>
-</span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a>        <span class="p">]</span> <span class="o">=</span> <span class="sa">f</span><span class="s1">&#39;np.where(X &lt;</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">, X, np.where(X &gt;</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">, np.round(np.log(X-</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">)*</span><span class="si">{</span><span class="n">resolution</span><span class="si">}</span><span class="s1">,0), 0))&#39;</span>
-</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a>
-</span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a><span class="k">for</span> <span class="n">resolution</span> <span class="ow">in</span> <span class="n">resolution_range</span><span class="p">:</span>
-</span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a>    <span class="k">for</span> <span class="n">greater_than</span> <span class="ow">in</span> <span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">divide</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="mi">100</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">greater_than_range</span><span class="p">]:</span>
-</span><span id="L-28"><a href="#L-28"><span class="linenos">28</span></a>        <span class="n">FW_TRANSFORMERS</span><span class="p">[</span>
-</span><span id="L-29"><a href="#L-29"><span class="linenos">29</span></a>            <span class="sa">f</span><span class="s1">&#39;_tr_fw_prob_sqrt_res_</span><span class="si">{</span><span class="n">resolution</span><span class="si">}</span><span class="s1">_gt_</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">&#39;</span>
-</span><span id="L-30"><a href="#L-30"><span class="linenos">30</span></a>        <span class="p">]</span> <span class="o">=</span> <span class="sa">f</span><span class="s1">&#39;np.where(X &lt; </span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">, X, np.where(X&gt;</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">, np.round(np.sqrt(X-</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">)*</span><span class="si">{</span><span class="n">resolution</span><span class="si">}</span><span class="s1">,0), 0))&#39;</span>
-</span><span id="L-31"><a href="#L-31"><span class="linenos">31</span></a>
-</span><span id="L-32"><a href="#L-32"><span class="linenos">32</span></a>        <span class="n">FW_TRANSFORMERS</span><span class="p">[</span>
-</span><span id="L-33"><a href="#L-33"><span class="linenos">33</span></a>            <span class="sa">f</span><span class="s1">&#39;_tr_fw_prob_log_res_</span><span class="si">{</span><span class="n">resolution</span><span class="si">}</span><span class="s1">_gt_</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">&#39;</span>
-</span><span id="L-34"><a href="#L-34"><span class="linenos">34</span></a>        <span class="p">]</span> <span class="o">=</span> <span class="sa">f</span><span class="s1">&#39;np.where(X &lt;</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">,X, np.where(X&gt;</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">, np.round(np.log(X-</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">)*</span><span class="si">{</span><span class="n">resolution</span><span class="si">}</span><span class="s1">,0), 0))&#39;</span>
-</span><span id="L-35"><a href="#L-35"><span class="linenos">35</span></a>
-</span><span id="L-36"><a href="#L-36"><span class="linenos">36</span></a><span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s1">&#39;__main__&#39;</span><span class="p">:</span>
-</span><span id="L-37"><a href="#L-37"><span class="linenos">37</span></a>    <span class="nb">print</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">FW_TRANSFORMERS</span><span class="p">))</span>
+</span><span id="L-5"><a href="#L-5"><span class="linenos"> 5</span></a><span class="kn">from</span> <span class="nn">outrank.feature_transformations.feature_transformer_vault.default_transformers</span> <span class="kn">import</span> \
+</span><span id="L-6"><a href="#L-6"><span class="linenos"> 6</span></a>    <span class="n">DEFAULT_TRANSFORMERS</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos"> 7</span></a>
+</span><span id="L-8"><a href="#L-8"><span class="linenos"> 8</span></a><span class="n">FW_TRANSFORMERS</span> <span class="o">=</span> <span class="n">DEFAULT_TRANSFORMERS</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="L-9"><a href="#L-9"><span class="linenos"> 9</span></a><span class="n">resolution_range</span> <span class="o">=</span> <span class="p">[</span><span class="mi">1</span><span class="p">,</span> <span class="mi">10</span><span class="p">,</span> <span class="mi">50</span><span class="p">,</span> <span class="mi">100</span><span class="p">]</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos">10</span></a><span class="n">greater_than_range</span> <span class="o">=</span> <span class="p">[</span><span class="mi">1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">8</span><span class="p">,</span> <span class="mi">16</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">64</span><span class="p">,</span> <span class="mi">96</span><span class="p">]</span>
+</span><span id="L-11"><a href="#L-11"><span class="linenos">11</span></a>
+</span><span id="L-12"><a href="#L-12"><span class="linenos">12</span></a><span class="k">for</span> <span class="n">resolution</span> <span class="ow">in</span> <span class="n">resolution_range</span><span class="p">:</span>
+</span><span id="L-13"><a href="#L-13"><span class="linenos">13</span></a>    <span class="k">for</span> <span class="n">greater_than</span> <span class="ow">in</span> <span class="n">greater_than_range</span><span class="p">:</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos">14</span></a>        <span class="n">FW_TRANSFORMERS</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;_tr_fw_sqrt_res_</span><span class="si">{</span><span class="n">resolution</span><span class="si">}</span><span class="s1">_gt_</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="L-15"><a href="#L-15"><span class="linenos">15</span></a>            <span class="sa">f</span><span class="s1">&#39;np.where(X &lt; </span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">, &#39;</span>
+</span><span id="L-16"><a href="#L-16"><span class="linenos">16</span></a>            <span class="sa">f</span><span class="s1">&#39;X, &#39;</span>
+</span><span id="L-17"><a href="#L-17"><span class="linenos">17</span></a>            <span class="sa">f</span><span class="s1">&#39;np.where(X&gt;</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1"> ,&#39;</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos">18</span></a>            <span class="sa">f</span><span class="s1">&#39;np.round(np.sqrt(X-</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">)*</span><span class="si">{</span><span class="n">resolution</span><span class="si">}</span><span class="s1">,0), 0))&#39;</span>
+</span><span id="L-19"><a href="#L-19"><span class="linenos">19</span></a>        <span class="p">)</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos">20</span></a>
+</span><span id="L-21"><a href="#L-21"><span class="linenos">21</span></a>        <span class="n">FW_TRANSFORMERS</span><span class="p">[</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos">22</span></a>            <span class="sa">f</span><span class="s1">&#39;_tr_fw_log_res_</span><span class="si">{</span><span class="n">resolution</span><span class="si">}</span><span class="s1">_gt_</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">&#39;</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos">23</span></a>        <span class="p">]</span> <span class="o">=</span> <span class="sa">f</span><span class="s1">&#39;np.where(X &lt;</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">, X, np.where(X &gt;</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">, np.round(np.log(X-</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">)*</span><span class="si">{</span><span class="n">resolution</span><span class="si">}</span><span class="s1">,0), 0))&#39;</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a>
+</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a><span class="k">for</span> <span class="n">resolution</span> <span class="ow">in</span> <span class="n">resolution_range</span><span class="p">:</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a>    <span class="k">for</span> <span class="n">greater_than</span> <span class="ow">in</span> <span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">divide</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="mi">100</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">greater_than_range</span><span class="p">]:</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a>        <span class="n">FW_TRANSFORMERS</span><span class="p">[</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos">28</span></a>            <span class="sa">f</span><span class="s1">&#39;_tr_fw_prob_sqrt_res_</span><span class="si">{</span><span class="n">resolution</span><span class="si">}</span><span class="s1">_gt_</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">&#39;</span>
+</span><span id="L-29"><a href="#L-29"><span class="linenos">29</span></a>        <span class="p">]</span> <span class="o">=</span> <span class="sa">f</span><span class="s1">&#39;np.where(X &lt; </span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">, X, np.where(X&gt;</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">, np.round(np.sqrt(X-</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">)*</span><span class="si">{</span><span class="n">resolution</span><span class="si">}</span><span class="s1">,0), 0))&#39;</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos">30</span></a>
+</span><span id="L-31"><a href="#L-31"><span class="linenos">31</span></a>        <span class="n">FW_TRANSFORMERS</span><span class="p">[</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos">32</span></a>            <span class="sa">f</span><span class="s1">&#39;_tr_fw_prob_log_res_</span><span class="si">{</span><span class="n">resolution</span><span class="si">}</span><span class="s1">_gt_</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">&#39;</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos">33</span></a>        <span class="p">]</span> <span class="o">=</span> <span class="sa">f</span><span class="s1">&#39;np.where(X &lt;</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">,X, np.where(X&gt;</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">, np.round(np.log(X-</span><span class="si">{</span><span class="n">greater_than</span><span class="si">}</span><span class="s1">)*</span><span class="si">{</span><span class="n">resolution</span><span class="si">}</span><span class="s1">,0), 0))&#39;</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos">34</span></a>
+</span><span id="L-35"><a href="#L-35"><span class="linenos">35</span></a><span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s1">&#39;__main__&#39;</span><span class="p">:</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos">36</span></a>    <span class="nb">print</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">FW_TRANSFORMERS</span><span class="p">))</span>
 </span></pre></div>
 
 
@@ -107,11 +106,11 @@ <h1 class="modulename">
 <input id="FW_TRANSFORMERS-view-value" class="view-value-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
             <label class="view-value-button pdoc-button" for="FW_TRANSFORMERS-view-value"></label><span class="default_value">{&#39;_tr_sqrt&#39;: &#39;np.sqrt(X)&#39;, &#39;_tr_log(x+1)&#39;: &#39;np.log(X + 1)&#39;, &#39;_tr_sqrt(abs(x))&#39;: &#39;np.sqrt(np.abs(X))&#39;, &#39;_tr_log(abs(x)+1)&#39;: &#39;np.log(np.abs(X) + 1)&#39;, &#39;_tr_div(x,abs(x))*log(abs(x))&#39;: &#39;np.divide(X, np.abs(X)) * np.log(np.abs(X))&#39;, &#39;_tr_log(x + sqrt(pow(x,2), 1)&#39;: &#39;np.log(X + np.sqrt(np.power(X, 2) + 1))&#39;, &#39;_tr_log*sqrt&#39;: &#39;np.log(X + 1) * np.sqrt(X)&#39;, &#39;_tr_log*100&#39;: &#39;np.round(np.log(X + 1) * 100, 0)&#39;, &#39;_tr_nonzero&#39;: &#39;np.where(X != 0, 1, 0)&#39;, &#39;_tr_round(div(x,max))&#39;: &#39;np.round(np.divide(X, np.max(X)), 0)&#39;, &#39;_tr_fw_sqrt_res_1_gt_1&#39;: &#39;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*1,0), 0))&#39;, &#39;_tr_fw_log_res_1_gt_1&#39;: &#39;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*1,0), 0))&#39;, &#39;_tr_fw_sqrt_res_1_gt_2&#39;: &#39;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*1,0), 0))&#39;, &#39;_tr_fw_log_res_1_gt_2&#39;: &#39;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*1,0), 0))&#39;, &#39;_tr_fw_sqrt_res_1_gt_4&#39;: &#39;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*1,0), 0))&#39;, &#39;_tr_fw_log_res_1_gt_4&#39;: &#39;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*1,0), 0))&#39;, &#39;_tr_fw_sqrt_res_1_gt_8&#39;: &#39;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*1,0), 0))&#39;, &#39;_tr_fw_log_res_1_gt_8&#39;: &#39;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*1,0), 0))&#39;, &#39;_tr_fw_sqrt_res_1_gt_16&#39;: &#39;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*1,0), 0))&#39;, &#39;_tr_fw_log_res_1_gt_16&#39;: &#39;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*1,0), 0))&#39;, &#39;_tr_fw_sqrt_res_1_gt_32&#39;: &#39;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*1,0), 0))&#39;, &#39;_tr_fw_log_res_1_gt_32&#39;: &#39;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*1,0), 0))&#39;, &#39;_tr_fw_sqrt_res_1_gt_64&#39;: &#39;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*1,0), 0))&#39;, &#39;_tr_fw_log_res_1_gt_64&#39;: &#39;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*1,0), 0))&#39;, &#39;_tr_fw_sqrt_res_1_gt_96&#39;: &#39;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*1,0), 0))&#39;, &#39;_tr_fw_log_res_1_gt_96&#39;: &#39;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*1,0), 0))&#39;, &#39;_tr_fw_sqrt_res_10_gt_1&#39;: &#39;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*10,0), 0))&#39;, &#39;_tr_fw_log_res_10_gt_1&#39;: &#39;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*10,0), 0))&#39;, &#39;_tr_fw_sqrt_res_10_gt_2&#39;: &#39;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*10,0), 0))&#39;, &#39;_tr_fw_log_res_10_gt_2&#39;: &#39;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*10,0), 0))&#39;, &#39;_tr_fw_sqrt_res_10_gt_4&#39;: &#39;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*10,0), 0))&#39;, &#39;_tr_fw_log_res_10_gt_4&#39;: &#39;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*10,0), 0))&#39;, &#39;_tr_fw_sqrt_res_10_gt_8&#39;: &#39;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*10,0), 0))&#39;, &#39;_tr_fw_log_res_10_gt_8&#39;: &#39;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*10,0), 0))&#39;, &#39;_tr_fw_sqrt_res_10_gt_16&#39;: &#39;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*10,0), 0))&#39;, &#39;_tr_fw_log_res_10_gt_16&#39;: &#39;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*10,0), 0))&#39;, &#39;_tr_fw_sqrt_res_10_gt_32&#39;: &#39;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*10,0), 0))&#39;, &#39;_tr_fw_log_res_10_gt_32&#39;: &#39;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*10,0), 0))&#39;, &#39;_tr_fw_sqrt_res_10_gt_64&#39;: &#39;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*10,0), 0))&#39;, &#39;_tr_fw_log_res_10_gt_64&#39;: &#39;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*10,0), 0))&#39;, &#39;_tr_fw_sqrt_res_10_gt_96&#39;: &#39;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*10,0), 0))&#39;, &#39;_tr_fw_log_res_10_gt_96&#39;: &#39;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*10,0), 0))&#39;, &#39;_tr_fw_sqrt_res_50_gt_1&#39;: &#39;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*50,0), 0))&#39;, &#39;_tr_fw_log_res_50_gt_1&#39;: &#39;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*50,0), 0))&#39;, &#39;_tr_fw_sqrt_res_50_gt_2&#39;: &#39;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*50,0), 0))&#39;, &#39;_tr_fw_log_res_50_gt_2&#39;: &#39;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*50,0), 0))&#39;, &#39;_tr_fw_sqrt_res_50_gt_4&#39;: &#39;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*50,0), 0))&#39;, &#39;_tr_fw_log_res_50_gt_4&#39;: &#39;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*50,0), 0))&#39;, &#39;_tr_fw_sqrt_res_50_gt_8&#39;: &#39;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*50,0), 0))&#39;, &#39;_tr_fw_log_res_50_gt_8&#39;: &#39;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*50,0), 0))&#39;, &#39;_tr_fw_sqrt_res_50_gt_16&#39;: &#39;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*50,0), 0))&#39;, &#39;_tr_fw_log_res_50_gt_16&#39;: &#39;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*50,0), 0))&#39;, &#39;_tr_fw_sqrt_res_50_gt_32&#39;: &#39;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*50,0), 0))&#39;, &#39;_tr_fw_log_res_50_gt_32&#39;: &#39;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*50,0), 0))&#39;, &#39;_tr_fw_sqrt_res_50_gt_64&#39;: &#39;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*50,0), 0))&#39;, &#39;_tr_fw_log_res_50_gt_64&#39;: &#39;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*50,0), 0))&#39;, &#39;_tr_fw_sqrt_res_50_gt_96&#39;: &#39;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*50,0), 0))&#39;, &#39;_tr_fw_log_res_50_gt_96&#39;: &#39;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*50,0), 0))&#39;, &#39;_tr_fw_sqrt_res_100_gt_1&#39;: &#39;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*100,0), 0))&#39;, &#39;_tr_fw_log_res_100_gt_1&#39;: &#39;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*100,0), 0))&#39;, &#39;_tr_fw_sqrt_res_100_gt_2&#39;: &#39;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*100,0), 0))&#39;, &#39;_tr_fw_log_res_100_gt_2&#39;: &#39;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*100,0), 0))&#39;, &#39;_tr_fw_sqrt_res_100_gt_4&#39;: &#39;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*100,0), 0))&#39;, &#39;_tr_fw_log_res_100_gt_4&#39;: &#39;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*100,0), 0))&#39;, &#39;_tr_fw_sqrt_res_100_gt_8&#39;: &#39;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*100,0), 0))&#39;, &#39;_tr_fw_log_res_100_gt_8&#39;: &#39;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*100,0), 0))&#39;, &#39;_tr_fw_sqrt_res_100_gt_16&#39;: &#39;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*100,0), 0))&#39;, &#39;_tr_fw_log_res_100_gt_16&#39;: &#39;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*100,0), 0))&#39;, &#39;_tr_fw_sqrt_res_100_gt_32&#39;: &#39;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*100,0), 0))&#39;, &#39;_tr_fw_log_res_100_gt_32&#39;: &#39;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*100,0), 0))&#39;, &#39;_tr_fw_sqrt_res_100_gt_64&#39;: &#39;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*100,0), 0))&#39;, &#39;_tr_fw_log_res_100_gt_64&#39;: &#39;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*100,0), 0))&#39;, &#39;_tr_fw_sqrt_res_100_gt_96&#39;: &#39;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*100,0), 0))&#39;, &#39;_tr_fw_log_res_100_gt_96&#39;: &#39;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*100,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_1_gt_0.01&#39;: &#39;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*1,0), 0))&#39;, &#39;_tr_fw_prob_log_res_1_gt_0.01&#39;: &#39;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*1,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_1_gt_0.02&#39;: &#39;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*1,0), 0))&#39;, &#39;_tr_fw_prob_log_res_1_gt_0.02&#39;: &#39;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*1,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_1_gt_0.04&#39;: &#39;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*1,0), 0))&#39;, &#39;_tr_fw_prob_log_res_1_gt_0.04&#39;: &#39;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*1,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_1_gt_0.08&#39;: &#39;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*1,0), 0))&#39;, &#39;_tr_fw_prob_log_res_1_gt_0.08&#39;: &#39;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*1,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_1_gt_0.16&#39;: &#39;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*1,0), 0))&#39;, &#39;_tr_fw_prob_log_res_1_gt_0.16&#39;: &#39;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*1,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_1_gt_0.32&#39;: &#39;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*1,0), 0))&#39;, &#39;_tr_fw_prob_log_res_1_gt_0.32&#39;: &#39;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*1,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_1_gt_0.64&#39;: &#39;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*1,0), 0))&#39;, &#39;_tr_fw_prob_log_res_1_gt_0.64&#39;: &#39;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*1,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_1_gt_0.96&#39;: &#39;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*1,0), 0))&#39;, &#39;_tr_fw_prob_log_res_1_gt_0.96&#39;: &#39;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*1,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_10_gt_0.01&#39;: &#39;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*10,0), 0))&#39;, &#39;_tr_fw_prob_log_res_10_gt_0.01&#39;: &#39;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*10,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_10_gt_0.02&#39;: &#39;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*10,0), 0))&#39;, &#39;_tr_fw_prob_log_res_10_gt_0.02&#39;: &#39;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*10,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_10_gt_0.04&#39;: &#39;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*10,0), 0))&#39;, &#39;_tr_fw_prob_log_res_10_gt_0.04&#39;: &#39;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*10,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_10_gt_0.08&#39;: &#39;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*10,0), 0))&#39;, &#39;_tr_fw_prob_log_res_10_gt_0.08&#39;: &#39;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*10,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_10_gt_0.16&#39;: &#39;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*10,0), 0))&#39;, &#39;_tr_fw_prob_log_res_10_gt_0.16&#39;: &#39;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*10,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_10_gt_0.32&#39;: &#39;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*10,0), 0))&#39;, &#39;_tr_fw_prob_log_res_10_gt_0.32&#39;: &#39;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*10,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_10_gt_0.64&#39;: &#39;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*10,0), 0))&#39;, &#39;_tr_fw_prob_log_res_10_gt_0.64&#39;: &#39;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*10,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_10_gt_0.96&#39;: &#39;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*10,0), 0))&#39;, &#39;_tr_fw_prob_log_res_10_gt_0.96&#39;: &#39;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*10,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_50_gt_0.01&#39;: &#39;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*50,0), 0))&#39;, &#39;_tr_fw_prob_log_res_50_gt_0.01&#39;: &#39;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*50,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_50_gt_0.02&#39;: &#39;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*50,0), 0))&#39;, &#39;_tr_fw_prob_log_res_50_gt_0.02&#39;: &#39;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*50,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_50_gt_0.04&#39;: &#39;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*50,0), 0))&#39;, &#39;_tr_fw_prob_log_res_50_gt_0.04&#39;: &#39;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*50,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_50_gt_0.08&#39;: &#39;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*50,0), 0))&#39;, &#39;_tr_fw_prob_log_res_50_gt_0.08&#39;: &#39;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*50,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_50_gt_0.16&#39;: &#39;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*50,0), 0))&#39;, &#39;_tr_fw_prob_log_res_50_gt_0.16&#39;: &#39;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*50,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_50_gt_0.32&#39;: &#39;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*50,0), 0))&#39;, &#39;_tr_fw_prob_log_res_50_gt_0.32&#39;: &#39;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*50,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_50_gt_0.64&#39;: &#39;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*50,0), 0))&#39;, &#39;_tr_fw_prob_log_res_50_gt_0.64&#39;: &#39;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*50,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_50_gt_0.96&#39;: &#39;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*50,0), 0))&#39;, &#39;_tr_fw_prob_log_res_50_gt_0.96&#39;: &#39;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*50,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_100_gt_0.01&#39;: &#39;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*100,0), 0))&#39;, &#39;_tr_fw_prob_log_res_100_gt_0.01&#39;: &#39;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*100,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_100_gt_0.02&#39;: &#39;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*100,0), 0))&#39;, &#39;_tr_fw_prob_log_res_100_gt_0.02&#39;: &#39;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*100,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_100_gt_0.04&#39;: &#39;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*100,0), 0))&#39;, &#39;_tr_fw_prob_log_res_100_gt_0.04&#39;: &#39;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*100,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_100_gt_0.08&#39;: &#39;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*100,0), 0))&#39;, &#39;_tr_fw_prob_log_res_100_gt_0.08&#39;: &#39;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*100,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_100_gt_0.16&#39;: &#39;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*100,0), 0))&#39;, &#39;_tr_fw_prob_log_res_100_gt_0.16&#39;: &#39;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*100,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_100_gt_0.32&#39;: &#39;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*100,0), 0))&#39;, &#39;_tr_fw_prob_log_res_100_gt_0.32&#39;: &#39;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*100,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_100_gt_0.64&#39;: &#39;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*100,0), 0))&#39;, &#39;_tr_fw_prob_log_res_100_gt_0.64&#39;: &#39;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*100,0), 0))&#39;, &#39;_tr_fw_prob_sqrt_res_100_gt_0.96&#39;: &#39;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*100,0), 0))&#39;, &#39;_tr_fw_prob_log_res_100_gt_0.96&#39;: &#39;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*100,0), 0))&#39;}</span>
 
-
+        
     </div>
     <a class="headerlink" href="#FW_TRANSFORMERS"></a>
-
-
+    
+    
 
                 </section>
                 <section id="resolution_range">
@@ -119,11 +118,11 @@ <h1 class="modulename">
             <span class="name">resolution_range</span>        =
 <span class="default_value">[1, 10, 50, 100]</span>
 
-
+        
     </div>
     <a class="headerlink" href="#resolution_range"></a>
-
-
+    
+    
 
                 </section>
                 <section id="greater_than_range">
@@ -131,11 +130,11 @@ <h1 class="modulename">
             <span class="name">greater_than_range</span>        =
 <span class="default_value">[1, 2, 4, 8, 16, 32, 64, 96]</span>
 
-
+        
     </div>
     <a class="headerlink" href="#greater_than_range"></a>
-
-
+    
+    
 
                 </section>
     </main>
@@ -321,4 +320,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/feature_transformations/ranking_transformers.html b/docs/outrank/feature_transformations/ranking_transformers.html
index 458b822..f87af0b 100644
--- a/docs/outrank/feature_transformations/ranking_transformers.html
+++ b/docs/outrank/feature_transformations/ranking_transformers.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.feature_transformations.ranking_transformers API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -88,7 +88,7 @@ <h2>API Documentation</h2>
                     <h1 class="modulename">
 <a href="./../../outrank.html">outrank</a><wbr>.<a href="./../feature_transformations.html">feature_transformations</a><wbr>.ranking_transformers    </h1>
 
-
+                
                         <input id="mod-ranking_transformers-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 
                         <label class="view-source-button" for="mod-ranking_transformers-view-source"><span>View Source</span></label>
@@ -268,7 +268,7 @@ <h1 class="modulename">
                 <section id="FeatureTransformerNoise">
                             <input id="FeatureTransformerNoise-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr class">
-
+            
     <span class="def">class</span>
     <span class="name">FeatureTransformerNoise</span>:
 
@@ -334,23 +334,23 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                             <div id="FeatureTransformerNoise.noise_preset" class="classattr">
                                 <div class="attr variable">
             <span class="name">noise_preset</span>
 
-
+        
     </div>
     <a class="headerlink" href="#FeatureTransformerNoise.noise_preset"></a>
-
-
+    
+    
 
                             </div>
                             <div id="FeatureTransformerNoise.construct_new_features" class="classattr">
                                         <input id="FeatureTransformerNoise.construct_new_features-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">construct_new_features</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">dataframe</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>, </span><span class="param"><span class="n">label_column</span><span class="o">=</span><span class="kc">None</span></span><span class="return-annotation">):</span></span>
 
@@ -421,7 +421,7 @@ <h1 class="modulename">
                 <section id="FeatureTransformerGeneric">
                             <input id="FeatureTransformerGeneric-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr class">
-
+            
     <span class="def">class</span>
     <span class="name">FeatureTransformerGeneric</span>:
 
@@ -525,12 +525,12 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                             <div id="FeatureTransformerGeneric.__init__" class="classattr">
                                         <input id="FeatureTransformerGeneric.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="name">FeatureTransformerGeneric</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">numeric_column_names</span><span class="p">:</span> <span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span>, </span><span class="param"><span class="n">preset</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;default&#39;</span></span>)</span>
 
                 <label class="view-source-button" for="FeatureTransformerGeneric.__init__-view-source"><span>View Source</span></label>
@@ -565,57 +565,57 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                             </div>
                             <div id="FeatureTransformerGeneric.numeric_column_names" class="classattr">
                                 <div class="attr variable">
             <span class="name">numeric_column_names</span>
 
-
+        
     </div>
     <a class="headerlink" href="#FeatureTransformerGeneric.numeric_column_names"></a>
-
-
+    
+    
 
                             </div>
                             <div id="FeatureTransformerGeneric.constructed_feature_names" class="classattr">
                                 <div class="attr variable">
             <span class="name">constructed_feature_names</span><span class="annotation">: set[str]</span>
 
-
+        
     </div>
     <a class="headerlink" href="#FeatureTransformerGeneric.constructed_feature_names"></a>
-
-
+    
+    
 
                             </div>
                             <div id="FeatureTransformerGeneric.max_maj_support" class="classattr">
                                 <div class="attr variable">
             <span class="name">max_maj_support</span>
 
-
+        
     </div>
     <a class="headerlink" href="#FeatureTransformerGeneric.max_maj_support"></a>
-
-
+    
+    
 
                             </div>
                             <div id="FeatureTransformerGeneric.nan_prop_support" class="classattr">
                                 <div class="attr variable">
             <span class="name">nan_prop_support</span>
 
-
+        
     </div>
     <a class="headerlink" href="#FeatureTransformerGeneric.nan_prop_support"></a>
-
-
+    
+    
 
                             </div>
                             <div id="FeatureTransformerGeneric.get_vals" class="classattr">
                                         <input id="FeatureTransformerGeneric.get_vals-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">get_vals</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">tmp_df</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>, </span><span class="param"><span class="n">col_name</span><span class="p">:</span> <span class="nb">str</span></span><span class="return-annotation">) -> <span class="n">Any</span>:</span></span>
 
@@ -632,13 +632,13 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                             </div>
                             <div id="FeatureTransformerGeneric.construct_baseline_features" class="classattr">
                                         <input id="FeatureTransformerGeneric.construct_baseline_features-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">construct_baseline_features</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">dataframe</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>:</span></span>
 
@@ -661,13 +661,13 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                             </div>
                             <div id="FeatureTransformerGeneric.construct_new_features" class="classattr">
                                         <input id="FeatureTransformerGeneric.construct_new_features-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">construct_new_features</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">dataframe</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>:</span></span>
 
@@ -724,7 +724,7 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                             </div>
                 </section>
@@ -911,4 +911,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/task_generators.html b/docs/outrank/task_generators.html
index 17abb63..17df4af 100644
--- a/docs/outrank/task_generators.html
+++ b/docs/outrank/task_generators.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.task_generators API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -52,7 +52,7 @@ <h2>API Documentation</h2>
                     <h1 class="modulename">
 <a href="./../outrank.html">outrank</a><wbr>.task_generators    </h1>
 
-
+                
                         <input id="mod-task_generators-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 
                         <label class="view-source-button" for="mod-task_generators-view-source"><span>View Source</span></label>
@@ -111,17 +111,17 @@ <h1 class="modulename">
             <span class="name">logger</span>        =
 <span class="default_value">&lt;Logger syn-logger (DEBUG)&gt;</span>
 
-
+        
     </div>
     <a class="headerlink" href="#logger"></a>
-
-
+    
+    
 
                 </section>
                 <section id="outrank_task_generate_data_set">
                             <input id="outrank_task_generate_data_set-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">outrank_task_generate_data_set</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">args</span></span><span class="return-annotation">):</span></span>
 
@@ -346,4 +346,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/task_instance_ranking.html b/docs/outrank/task_instance_ranking.html
new file mode 100644
index 0000000..49c7a7e
--- /dev/null
+++ b/docs/outrank/task_instance_ranking.html
@@ -0,0 +1,521 @@
+<!doctype html>
+<html lang="en">
+<head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="pdoc 14.5.1"/>
+    <title>outrank.task_instance_ranking API documentation</title>
+
+    <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
+    <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
+    <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! custom.css */</style></head>
+<body>
+    <nav class="pdoc">
+        <label id="navtoggle" for="togglestate" class="pdoc-button"><svg xmlns='http://www.w3.org/2000/svg' viewBox='0 0 30 30'><path stroke-linecap='round' stroke="currentColor" stroke-miterlimit='10' stroke-width='2' d='M4 7h22M4 15h22M4 23h22'/></svg></label>
+        <input id="togglestate" type="checkbox" aria-hidden="true" tabindex="-1">
+        <div>            <a class="pdoc-button module-list-button" href="../outrank.html">
+<svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" fill="currentColor" class="bi bi-box-arrow-in-left" viewBox="0 0 16 16">
+  <path fill-rule="evenodd" d="M10 3.5a.5.5 0 0 0-.5-.5h-8a.5.5 0 0 0-.5.5v9a.5.5 0 0 0 .5.5h8a.5.5 0 0 0 .5-.5v-2a.5.5 0 0 1 1 0v2A1.5 1.5 0 0 1 9.5 14h-8A1.5 1.5 0 0 1 0 12.5v-9A1.5 1.5 0 0 1 1.5 2h8A1.5 1.5 0 0 1 11 3.5v2a.5.5 0 0 1-1 0v-2z"/>
+  <path fill-rule="evenodd" d="M4.146 8.354a.5.5 0 0 1 0-.708l3-3a.5.5 0 1 1 .708.708L5.707 7.5H14.5a.5.5 0 0 1 0 1H5.707l2.147 2.146a.5.5 0 0 1-.708.708l-3-3z"/>
+</svg>                &nbsp;outrank</a>
+
+
+            <input type="search" placeholder="Search..." role="searchbox" aria-label="search"
+                   pattern=".+" required>
+
+
+
+            <h2>API Documentation</h2>
+                <ul class="memberlist">
+            <li>
+                    <a class="function" href="#shannon_ent">shannon_ent</a>
+            </li>
+            <li>
+                    <a class="function" href="#compute_entropy_avg">compute_entropy_avg</a>
+            </li>
+            <li>
+                    <a class="function" href="#score_line">score_line</a>
+            </li>
+            <li>
+                    <a class="function" href="#outrank_task_rank_instances">outrank_task_rank_instances</a>
+            </li>
+    </ul>
+
+
+
+        <a class="attribution" title="pdoc: Python API documentation generator" href="https://pdoc.dev" target="_blank">
+            built with <span class="visually-hidden">pdoc</span><img
+                alt="pdoc logo"
+                src="data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20role%3D%22img%22%20aria-label%3D%22pdoc%20logo%22%20width%3D%22300%22%20height%3D%22150%22%20viewBox%3D%22-1%200%2060%2030%22%3E%3Ctitle%3Epdoc%3C/title%3E%3Cpath%20d%3D%22M29.621%2021.293c-.011-.273-.214-.475-.511-.481a.5.5%200%200%200-.489.503l-.044%201.393c-.097.551-.695%201.215-1.566%201.704-.577.428-1.306.486-2.193.182-1.426-.617-2.467-1.654-3.304-2.487l-.173-.172a3.43%203.43%200%200%200-.365-.306.49.49%200%200%200-.286-.196c-1.718-1.06-4.931-1.47-7.353.191l-.219.15c-1.707%201.187-3.413%202.131-4.328%201.03-.02-.027-.49-.685-.141-1.763.233-.721.546-2.408.772-4.076.042-.09.067-.187.046-.288.166-1.347.277-2.625.241-3.351%201.378-1.008%202.271-2.586%202.271-4.362%200-.976-.272-1.935-.788-2.774-.057-.094-.122-.18-.184-.268.033-.167.052-.339.052-.516%200-1.477-1.202-2.679-2.679-2.679-.791%200-1.496.352-1.987.9a6.3%206.3%200%200%200-1.001.029c-.492-.564-1.207-.929-2.012-.929-1.477%200-2.679%201.202-2.679%202.679A2.65%202.65%200%200%200%20.97%206.554c-.383.747-.595%201.572-.595%202.41%200%202.311%201.507%204.29%203.635%205.107-.037.699-.147%202.27-.423%203.294l-.137.461c-.622%202.042-2.515%208.257%201.727%2010.643%201.614.908%203.06%201.248%204.317%201.248%202.665%200%204.492-1.524%205.322-2.401%201.476-1.559%202.886-1.854%206.491.82%201.877%201.393%203.514%201.753%204.861%201.068%202.223-1.713%202.811-3.867%203.399-6.374.077-.846.056-1.469.054-1.537zm-4.835%204.313c-.054.305-.156.586-.242.629-.034-.007-.131-.022-.307-.157-.145-.111-.314-.478-.456-.908.221.121.432.25.675.355.115.039.219.051.33.081zm-2.251-1.238c-.05.33-.158.648-.252.694-.022.001-.125-.018-.307-.157-.217-.166-.488-.906-.639-1.573.358.344.754.693%201.198%201.036zm-3.887-2.337c-.006-.116-.018-.231-.041-.342.635.145%201.189.368%201.599.625.097.231.166.481.174.642-.03.049-.055.101-.067.158-.046.013-.128.026-.298.004-.278-.037-.901-.57-1.367-1.087zm-1.127-.497c.116.306.176.625.12.71-.019.014-.117.045-.345.016-.206-.027-.604-.332-.986-.695.41-.051.816-.056%201.211-.031zm-4.535%201.535c.209.22.379.47.358.598-.006.041-.088.138-.351.234-.144.055-.539-.063-.979-.259a11.66%2011.66%200%200%200%20.972-.573zm.983-.664c.359-.237.738-.418%201.126-.554.25.237.479.548.457.694-.006.042-.087.138-.351.235-.174.064-.694-.105-1.232-.375zm-3.381%201.794c-.022.145-.061.29-.149.401-.133.166-.358.248-.69.251h-.002c-.133%200-.306-.26-.45-.621.417.091.854.07%201.291-.031zm-2.066-8.077a4.78%204.78%200%200%201-.775-.584c.172-.115.505-.254.88-.378l-.105.962zm-.331%202.302a10.32%2010.32%200%200%201-.828-.502c.202-.143.576-.328.984-.49l-.156.992zm-.45%202.157l-.701-.403c.214-.115.536-.249.891-.376a11.57%2011.57%200%200%201-.19.779zm-.181%201.716c.064.398.194.702.298.893-.194-.051-.435-.162-.736-.398.061-.119.224-.3.438-.495zM8.87%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zm-.735-.389a1.15%201.15%200%200%200-.314.783%201.16%201.16%200%200%200%201.162%201.162c.457%200%20.842-.27%201.032-.653.026.117.042.238.042.362a1.68%201.68%200%200%201-1.679%201.679%201.68%201.68%200%200%201-1.679-1.679c0-.843.626-1.535%201.436-1.654zM5.059%205.406A1.68%201.68%200%200%201%203.38%207.085a1.68%201.68%200%200%201-1.679-1.679c0-.037.009-.072.011-.109.21.3.541.508.935.508a1.16%201.16%200%200%200%201.162-1.162%201.14%201.14%200%200%200-.474-.912c.015%200%20.03-.005.045-.005.926.001%201.679.754%201.679%201.68zM3.198%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zM1.375%208.964c0-.52.103-1.035.288-1.52.466.394%201.06.64%201.717.64%201.144%200%202.116-.725%202.499-1.738.383%201.012%201.355%201.738%202.499%201.738.867%200%201.631-.421%202.121-1.062.307.605.478%201.267.478%201.942%200%202.486-2.153%204.51-4.801%204.51s-4.801-2.023-4.801-4.51zm24.342%2019.349c-.985.498-2.267.168-3.813-.979-3.073-2.281-5.453-3.199-7.813-.705-1.315%201.391-4.163%203.365-8.423.97-3.174-1.786-2.239-6.266-1.261-9.479l.146-.492c.276-1.02.395-2.457.444-3.268a6.11%206.11%200%200%200%201.18.115%206.01%206.01%200%200%200%202.536-.562l-.006.175c-.802.215-1.848.612-2.021%201.25-.079.295.021.601.274.837.219.203.415.364.598.501-.667.304-1.243.698-1.311%201.179-.02.144-.022.507.393.787.213.144.395.26.564.365-1.285.521-1.361.96-1.381%201.126-.018.142-.011.496.427.746l.854.489c-.473.389-.971.914-.999%201.429-.018.278.095.532.316.713.675.556%201.231.721%201.653.721.059%200%20.104-.014.158-.02.207.707.641%201.64%201.513%201.64h.013c.8-.008%201.236-.345%201.462-.626.173-.216.268-.457.325-.692.424.195.93.374%201.372.374.151%200%20.294-.021.423-.068.732-.27.944-.704.993-1.021.009-.061.003-.119.002-.179.266.086.538.147.789.147.15%200%20.294-.021.423-.069.542-.2.797-.489.914-.754.237.147.478.258.704.288.106.014.205.021.296.021.356%200%20.595-.101.767-.229.438.435%201.094.992%201.656%201.067.106.014.205.021.296.021a1.56%201.56%200%200%200%20.323-.035c.17.575.453%201.289.866%201.605.358.273.665.362.914.362a.99.99%200%200%200%20.421-.093%201.03%201.03%200%200%200%20.245-.164c.168.428.39.846.68%201.068.358.273.665.362.913.362a.99.99%200%200%200%20.421-.093c.317-.148.512-.448.639-.762.251.157.495.257.726.257.127%200%20.25-.024.37-.071.427-.17.706-.617.841-1.314.022-.015.047-.022.068-.038.067-.051.133-.104.196-.159-.443%201.486-1.107%202.761-2.086%203.257zM8.66%209.925a.5.5%200%201%200-1%200c0%20.653-.818%201.205-1.787%201.205s-1.787-.552-1.787-1.205a.5.5%200%201%200-1%200c0%201.216%201.25%202.205%202.787%202.205s2.787-.989%202.787-2.205zm4.4%2015.965l-.208.097c-2.661%201.258-4.708%201.436-6.086.527-1.542-1.017-1.88-3.19-1.844-4.198a.4.4%200%200%200-.385-.414c-.242-.029-.406.164-.414.385-.046%201.249.367%203.686%202.202%204.896.708.467%201.547.7%202.51.7%201.248%200%202.706-.392%204.362-1.174l.185-.086a.4.4%200%200%200%20.205-.527c-.089-.204-.326-.291-.527-.206zM9.547%202.292c.093.077.205.114.317.114a.5.5%200%200%200%20.318-.886L8.817.397a.5.5%200%200%200-.703.068.5.5%200%200%200%20.069.703l1.364%201.124zm-7.661-.065c.086%200%20.173-.022.253-.068l1.523-.893a.5.5%200%200%200-.506-.863l-1.523.892a.5.5%200%200%200-.179.685c.094.158.261.247.432.247z%22%20transform%3D%22matrix%28-1%200%200%201%2058%200%29%22%20fill%3D%22%233bb300%22/%3E%3Cpath%20d%3D%22M.3%2021.86V10.18q0-.46.02-.68.04-.22.18-.5.28-.54%201.34-.54%201.06%200%201.42.28.38.26.44.78.76-1.04%202.38-1.04%201.64%200%203.1%201.54%201.46%201.54%201.46%203.58%200%202.04-1.46%203.58-1.44%201.54-3.08%201.54-1.64%200-2.38-.92v4.04q0%20.46-.04.68-.02.22-.18.5-.14.3-.5.42-.36.12-.98.12-.62%200-1-.12-.36-.12-.52-.4-.14-.28-.18-.5-.02-.22-.02-.68zm3.96-9.42q-.46.54-.46%201.18%200%20.64.46%201.18.48.52%201.2.52.74%200%201.24-.52.52-.52.52-1.18%200-.66-.48-1.18-.48-.54-1.26-.54-.76%200-1.22.54zm14.741-8.36q.16-.3.54-.42.38-.12%201-.12.64%200%201.02.12.38.12.52.42.16.3.18.54.04.22.04.68v11.94q0%20.46-.04.7-.02.22-.18.5-.3.54-1.7.54-1.38%200-1.54-.98-.84.96-2.34.96-1.8%200-3.28-1.56-1.48-1.58-1.48-3.66%200-2.1%201.48-3.68%201.5-1.58%203.28-1.58%201.48%200%202.3%201v-4.2q0-.46.02-.68.04-.24.18-.52zm-3.24%2010.86q.52.54%201.26.54.74%200%201.22-.54.5-.54.5-1.18%200-.66-.48-1.22-.46-.56-1.26-.56-.8%200-1.28.56-.48.54-.48%201.2%200%20.66.52%201.2zm7.833-1.2q0-2.4%201.68-3.96%201.68-1.56%203.84-1.56%202.16%200%203.82%201.56%201.66%201.54%201.66%203.94%200%201.66-.86%202.96-.86%201.28-2.1%201.9-1.22.6-2.54.6-1.32%200-2.56-.64-1.24-.66-2.1-1.92-.84-1.28-.84-2.88zm4.18%201.44q.64.48%201.3.48.66%200%201.32-.5.66-.5.66-1.48%200-.98-.62-1.46-.62-.48-1.34-.48-.72%200-1.34.5-.62.5-.62%201.48%200%20.96.64%201.46zm11.412-1.44q0%20.84.56%201.32.56.46%201.18.46.64%200%201.18-.36.56-.38.9-.38.6%200%201.46%201.06.46.58.46%201.04%200%20.76-1.1%201.42-1.14.8-2.8.8-1.86%200-3.58-1.34-.82-.64-1.34-1.7-.52-1.08-.52-2.36%200-1.3.52-2.34.52-1.06%201.34-1.7%201.66-1.32%203.54-1.32.76%200%201.48.22.72.2%201.06.4l.32.2q.36.24.56.38.52.4.52.92%200%20.5-.42%201.14-.72%201.1-1.38%201.1-.38%200-1.08-.44-.36-.34-1.04-.34-.66%200-1.24.48-.58.48-.58%201.34z%22%20fill%3D%22green%22/%3E%3C/svg%3E"/>
+        </a>
+</div>
+    </nav>
+    <main class="pdoc">
+            <section class="module-info">
+                    <h1 class="modulename">
+<a href="./../outrank.html">outrank</a><wbr>.task_instance_ranking    </h1>
+
+                
+                        <input id="mod-task_instance_ranking-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+
+                        <label class="view-source-button" for="mod-task_instance_ranking-view-source"><span>View Source</span></label>
+
+                        <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos">  1</span></a><span class="kn">from</span> <span class="nn">__future__</span> <span class="kn">import</span> <span class="n">annotations</span>
+</span><span id="L-2"><a href="#L-2"><span class="linenos">  2</span></a>
+</span><span id="L-3"><a href="#L-3"><span class="linenos">  3</span></a><span class="kn">import</span> <span class="nn">gzip</span>
+</span><span id="L-4"><a href="#L-4"><span class="linenos">  4</span></a><span class="kn">import</span> <span class="nn">os</span>
+</span><span id="L-5"><a href="#L-5"><span class="linenos">  5</span></a><span class="kn">from</span> <span class="nn">collections</span> <span class="kn">import</span> <span class="n">Counter</span>
+</span><span id="L-6"><a href="#L-6"><span class="linenos">  6</span></a><span class="kn">from</span> <span class="nn">collections</span> <span class="kn">import</span> <span class="n">defaultdict</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos">  7</span></a><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Any</span>
+</span><span id="L-8"><a href="#L-8"><span class="linenos">  8</span></a>
+</span><span id="L-9"><a href="#L-9"><span class="linenos">  9</span></a><span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos"> 10</span></a><span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
+</span><span id="L-11"><a href="#L-11"><span class="linenos"> 11</span></a><span class="kn">import</span> <span class="nn">tqdm</span>
+</span><span id="L-12"><a href="#L-12"><span class="linenos"> 12</span></a>
+</span><span id="L-13"><a href="#L-13"><span class="linenos"> 13</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">generic_line_parser</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos"> 14</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">get_dataset_info</span>
+</span><span id="L-15"><a href="#L-15"><span class="linenos"> 15</span></a><span class="kn">from</span> <span class="nn">outrank.core_utils</span> <span class="kn">import</span> <span class="n">get_num_of_instances</span>
+</span><span id="L-16"><a href="#L-16"><span class="linenos"> 16</span></a>
+</span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a><span class="k">try</span><span class="p">:</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a>    <span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
+</span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a><span class="k">except</span><span class="p">:</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a>    <span class="k">pass</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a>
+</span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a>
+</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a><span class="k">def</span> <span class="nf">shannon_ent</span><span class="p">(</span><span class="n">string</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a>    <span class="n">counts</span> <span class="o">=</span> <span class="n">Counter</span><span class="p">(</span><span class="n">string</span><span class="p">)</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a>    <span class="n">frequencies</span> <span class="o">=</span> <span class="p">((</span><span class="n">i</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">string</span><span class="p">))</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">counts</span><span class="o">.</span><span class="n">values</span><span class="p">())</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a>    <span class="k">return</span> <span class="o">-</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">f</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">log2</span><span class="p">(</span><span class="n">f</span><span class="p">)</span> <span class="k">for</span> <span class="n">f</span> <span class="ow">in</span> <span class="n">frequencies</span><span class="p">)</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a>
+</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a>
+</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a><span class="k">def</span> <span class="nf">compute_entropy_avg</span><span class="p">(</span><span class="n">line</span><span class="p">:</span> <span class="nb">list</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a>    <span class="n">joint_ent</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a>    <span class="k">for</span> <span class="n">field</span> <span class="ow">in</span> <span class="n">line</span><span class="p">:</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a>        <span class="n">joint_ent</span> <span class="o">+=</span> <span class="n">shannon_ent</span><span class="p">(</span><span class="n">field</span><span class="p">)</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a>    <span class="k">return</span> <span class="n">joint_ent</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a>
+</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a>
+</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a><span class="k">def</span> <span class="nf">score_line</span><span class="p">(</span><span class="n">line</span><span class="p">):</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a>    <span class="n">nan_prop</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="s1">&#39;&#39;</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">line</span><span class="p">)</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a>    <span class="n">out_struct</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a>    <span class="n">out_struct</span><span class="p">[</span><span class="s1">&#39;empty_string_prop&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">nan_prop</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a>    <span class="n">out_struct</span><span class="p">[</span><span class="s1">&#39;empty_dict&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="s1">&#39;</span><span class="si">{}</span><span class="s1">&#39;</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">line</span><span class="p">)</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a>    <span class="n">out_struct</span><span class="p">[</span><span class="s1">&#39;all_empty&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">line</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="s1">&#39;</span><span class="si">{}</span><span class="s1">&#39;</span><span class="p">)</span> <span class="o">+</span> <span class="n">line</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="s1">&#39;&#39;</span><span class="p">))</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">line</span><span class="p">)</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a>    <span class="n">out_struct</span><span class="p">[</span><span class="s1">&#39;all_zero&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="s1">&#39;0&#39;</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">line</span><span class="p">)</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a>    <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="p">[</span><span class="mi">30</span><span class="p">,</span> <span class="mi">60</span><span class="p">,</span> <span class="mi">100</span><span class="p">,</span> <span class="mi">200</span><span class="p">,</span> <span class="mi">300</span><span class="p">]:</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a>        <span class="n">out_struct</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;all_more_</span><span class="si">{</span><span class="n">j</span><span class="si">}</span><span class="s1">_chars&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a>            <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">line</span> <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">j</span><span class="p">],</span> <span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">line</span><span class="p">)</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a>    <span class="n">out_struct</span><span class="p">[</span><span class="s1">&#39;row_entropy&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">compute_entropy_avg</span><span class="p">(</span><span class="n">line</span><span class="p">)</span>
+</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a>    <span class="k">return</span> <span class="n">out_struct</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a>
+</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a>
+</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a><span class="k">def</span> <span class="nf">outrank_task_rank_instances</span><span class="p">(</span><span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a>
+</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a>    <span class="n">data_encoding</span> <span class="o">=</span> <span class="s1">&#39;utf-8&#39;</span>
+</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a>    <span class="n">delimiter</span> <span class="o">=</span> <span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a>    <span class="n">dataset_info</span> <span class="o">=</span> <span class="n">get_dataset_info</span><span class="p">(</span><span class="n">args</span><span class="p">)</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a>    <span class="n">local_pbar</span> <span class="o">=</span> <span class="n">tqdm</span><span class="o">.</span><span class="n">tqdm</span><span class="p">(</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a>        <span class="n">total</span><span class="o">=</span><span class="n">get_num_of_instances</span><span class="p">(</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">data_path</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a>        <span class="n">position</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a>        <span class="n">disable</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">disable_tqdm</span> <span class="o">==</span> <span class="s1">&#39;True&#39;</span><span class="p">,</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a>    <span class="p">)</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Starting ranking computation&#39;</span><span class="p">)</span>
+</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a>
+</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a>    <span class="n">_</span><span class="p">,</span> <span class="n">file_extension</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">splitext</span><span class="p">(</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">data_path</span><span class="p">)</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a>
+</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a>    <span class="k">if</span> <span class="n">file_extension</span> <span class="o">==</span> <span class="s1">&#39;.gz&#39;</span><span class="p">:</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>        <span class="n">file_stream</span> <span class="o">=</span> <span class="n">gzip</span><span class="o">.</span><span class="n">open</span><span class="p">(</span>
+</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a>            <span class="n">dataset_info</span><span class="o">.</span><span class="n">data_path</span><span class="p">,</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a>            <span class="s1">&#39;rt&#39;</span><span class="p">,</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a>            <span class="n">encoding</span><span class="o">=</span><span class="n">data_encoding</span><span class="p">,</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a>        <span class="p">)</span>
+</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>
+</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a>        <span class="n">file_stream</span> <span class="o">=</span> <span class="nb">open</span><span class="p">(</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">data_path</span><span class="p">,</span> <span class="n">encoding</span><span class="o">=</span><span class="n">data_encoding</span><span class="p">)</span>
+</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a>    <span class="n">line_counter</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a>    <span class="n">out_scores_lab</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
+</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a>
+</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a>    <span class="k">for</span> <span class="n">line</span> <span class="ow">in</span> <span class="n">file_stream</span><span class="p">:</span>
+</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a>        <span class="n">line_counter</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a>        <span class="n">local_pbar</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a>
+</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a>        <span class="n">parsed_line</span> <span class="o">=</span> <span class="n">generic_line_parser</span><span class="p">(</span>
+</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a>            <span class="n">line</span><span class="p">,</span>
+</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a>            <span class="n">delimiter</span><span class="p">,</span>
+</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a>            <span class="n">args</span><span class="p">,</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a>            <span class="n">dataset_info</span><span class="o">.</span><span class="n">fw_map</span><span class="p">,</span>
+</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a>            <span class="n">dataset_info</span><span class="o">.</span><span class="n">column_names</span><span class="p">,</span>
+</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>        <span class="p">)</span>
+</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a>
+</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a>        <span class="k">if</span> <span class="n">line_counter</span> <span class="o">&gt;</span> <span class="mi">100_000</span><span class="p">:</span>
+</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a>            <span class="k">break</span>
+</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a>        <span class="n">out_scores_lab</span><span class="p">[</span><span class="n">line</span><span class="p">[</span><span class="mi">0</span><span class="p">]]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">score_line</span><span class="p">(</span><span class="n">parsed_line</span><span class="p">))</span>
+</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a>
+</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a>    <span class="k">for</span> <span class="n">label</span><span class="p">,</span> <span class="n">out_scores</span> <span class="ow">in</span> <span class="n">out_scores_lab</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a>        <span class="n">out_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">out_scores</span><span class="p">)</span>
+</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a>        <span class="n">os</span><span class="o">.</span><span class="n">makedirs</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="p">,</span> <span class="n">exist_ok</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a>        <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">out_df</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
+</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a>            <span class="n">sorted_vals</span> <span class="o">=</span> <span class="n">out_df</span><span class="p">[</span><span class="n">col</span><span class="p">]</span><span class="o">.</span><span class="n">sort_values</span><span class="p">()</span>
+</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a>            <span class="n">plt</span><span class="o">.</span><span class="n">figure</span><span class="p">(</span><span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">5</span><span class="p">,</span> <span class="mi">5</span><span class="p">),</span> <span class="n">dpi</span><span class="o">=</span><span class="mi">300</span><span class="p">)</span>
+</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a>            <span class="n">plt</span><span class="o">.</span><span class="n">title</span><span class="p">(</span><span class="n">col</span> <span class="o">+</span> <span class="sa">f</span><span class="s1">&#39; label: </span><span class="si">{</span><span class="n">label</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>            <span class="n">plt</span><span class="o">.</span><span class="n">hist</span><span class="p">(</span>
+</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a>                <span class="n">x</span><span class="o">=</span><span class="n">sorted_vals</span> <span class="o">*</span> <span class="mi">100</span><span class="p">,</span>
+</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a>                <span class="n">color</span><span class="o">=</span><span class="s1">&#39;black&#39;</span><span class="p">,</span>
+</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a>                <span class="n">density</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a>                <span class="n">bins</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span>
+</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a>            <span class="p">)</span>
+</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>            <span class="k">if</span> <span class="s1">&#39;entropy&#39;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">col</span><span class="p">:</span>
+</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a>                <span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s1">&#39;Proportion of namespaces (%)&#39;</span><span class="p">)</span>
+</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a>                <span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s1">&#39;Row entropy&#39;</span><span class="p">)</span>
+</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a>            <span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="s1">&#39;Density&#39;</span><span class="p">)</span>
+</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a>            <span class="n">plt</span><span class="o">.</span><span class="n">tight_layout</span><span class="p">()</span>
+</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a>            <span class="n">fname</span> <span class="o">=</span> <span class="sa">f</span><span class="s1">&#39;distPlot</span><span class="si">{</span><span class="n">col</span><span class="si">}</span><span class="s1">_</span><span class="si">{</span><span class="n">label</span><span class="si">}</span><span class="s1">.pdf&#39;</span>
+</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a>            <span class="n">plt</span><span class="o">.</span><span class="n">savefig</span><span class="p">(</span><span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="p">,</span> <span class="n">fname</span><span class="p">),</span> <span class="n">dpi</span><span class="o">=</span><span class="mi">300</span><span class="p">)</span>
+</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a>            <span class="n">plt</span><span class="o">.</span><span class="n">cla</span><span class="p">()</span>
+</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a>            <span class="n">plt</span><span class="o">.</span><span class="n">clf</span><span class="p">()</span>
+</span></pre></div>
+
+
+            </section>
+                <section id="shannon_ent">
+                            <input id="shannon_ent-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">shannon_ent</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">string</span><span class="p">:</span> <span class="nb">str</span></span><span class="return-annotation">) -> <span class="nb">float</span>:</span></span>
+
+                <label class="view-source-button" for="shannon_ent-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#shannon_ent"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="shannon_ent-24"><a href="#shannon_ent-24"><span class="linenos">24</span></a><span class="k">def</span> <span class="nf">shannon_ent</span><span class="p">(</span><span class="n">string</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
+</span><span id="shannon_ent-25"><a href="#shannon_ent-25"><span class="linenos">25</span></a>    <span class="n">counts</span> <span class="o">=</span> <span class="n">Counter</span><span class="p">(</span><span class="n">string</span><span class="p">)</span>
+</span><span id="shannon_ent-26"><a href="#shannon_ent-26"><span class="linenos">26</span></a>    <span class="n">frequencies</span> <span class="o">=</span> <span class="p">((</span><span class="n">i</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">string</span><span class="p">))</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">counts</span><span class="o">.</span><span class="n">values</span><span class="p">())</span>
+</span><span id="shannon_ent-27"><a href="#shannon_ent-27"><span class="linenos">27</span></a>    <span class="k">return</span> <span class="o">-</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">f</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">log2</span><span class="p">(</span><span class="n">f</span><span class="p">)</span> <span class="k">for</span> <span class="n">f</span> <span class="ow">in</span> <span class="n">frequencies</span><span class="p">)</span>
+</span></pre></div>
+
+
+    
+
+                </section>
+                <section id="compute_entropy_avg">
+                            <input id="compute_entropy_avg-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">compute_entropy_avg</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">line</span><span class="p">:</span> <span class="nb">list</span></span><span class="return-annotation">) -> <span class="nb">float</span>:</span></span>
+
+                <label class="view-source-button" for="compute_entropy_avg-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#compute_entropy_avg"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_entropy_avg-30"><a href="#compute_entropy_avg-30"><span class="linenos">30</span></a><span class="k">def</span> <span class="nf">compute_entropy_avg</span><span class="p">(</span><span class="n">line</span><span class="p">:</span> <span class="nb">list</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
+</span><span id="compute_entropy_avg-31"><a href="#compute_entropy_avg-31"><span class="linenos">31</span></a>    <span class="n">joint_ent</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="compute_entropy_avg-32"><a href="#compute_entropy_avg-32"><span class="linenos">32</span></a>    <span class="k">for</span> <span class="n">field</span> <span class="ow">in</span> <span class="n">line</span><span class="p">:</span>
+</span><span id="compute_entropy_avg-33"><a href="#compute_entropy_avg-33"><span class="linenos">33</span></a>        <span class="n">joint_ent</span> <span class="o">+=</span> <span class="n">shannon_ent</span><span class="p">(</span><span class="n">field</span><span class="p">)</span>
+</span><span id="compute_entropy_avg-34"><a href="#compute_entropy_avg-34"><span class="linenos">34</span></a>    <span class="k">return</span> <span class="n">joint_ent</span>
+</span></pre></div>
+
+
+    
+
+                </section>
+                <section id="score_line">
+                            <input id="score_line-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">score_line</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">line</span></span><span class="return-annotation">):</span></span>
+
+                <label class="view-source-button" for="score_line-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#score_line"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="score_line-37"><a href="#score_line-37"><span class="linenos">37</span></a><span class="k">def</span> <span class="nf">score_line</span><span class="p">(</span><span class="n">line</span><span class="p">):</span>
+</span><span id="score_line-38"><a href="#score_line-38"><span class="linenos">38</span></a>    <span class="n">nan_prop</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="s1">&#39;&#39;</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">line</span><span class="p">)</span>
+</span><span id="score_line-39"><a href="#score_line-39"><span class="linenos">39</span></a>    <span class="n">out_struct</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="score_line-40"><a href="#score_line-40"><span class="linenos">40</span></a>    <span class="n">out_struct</span><span class="p">[</span><span class="s1">&#39;empty_string_prop&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">nan_prop</span>
+</span><span id="score_line-41"><a href="#score_line-41"><span class="linenos">41</span></a>    <span class="n">out_struct</span><span class="p">[</span><span class="s1">&#39;empty_dict&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="s1">&#39;</span><span class="si">{}</span><span class="s1">&#39;</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">line</span><span class="p">)</span>
+</span><span id="score_line-42"><a href="#score_line-42"><span class="linenos">42</span></a>    <span class="n">out_struct</span><span class="p">[</span><span class="s1">&#39;all_empty&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">line</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="s1">&#39;</span><span class="si">{}</span><span class="s1">&#39;</span><span class="p">)</span> <span class="o">+</span> <span class="n">line</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="s1">&#39;&#39;</span><span class="p">))</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">line</span><span class="p">)</span>
+</span><span id="score_line-43"><a href="#score_line-43"><span class="linenos">43</span></a>    <span class="n">out_struct</span><span class="p">[</span><span class="s1">&#39;all_zero&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="s1">&#39;0&#39;</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">line</span><span class="p">)</span>
+</span><span id="score_line-44"><a href="#score_line-44"><span class="linenos">44</span></a>    <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="p">[</span><span class="mi">30</span><span class="p">,</span> <span class="mi">60</span><span class="p">,</span> <span class="mi">100</span><span class="p">,</span> <span class="mi">200</span><span class="p">,</span> <span class="mi">300</span><span class="p">]:</span>
+</span><span id="score_line-45"><a href="#score_line-45"><span class="linenos">45</span></a>        <span class="n">out_struct</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;all_more_</span><span class="si">{</span><span class="n">j</span><span class="si">}</span><span class="s1">_chars&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span>
+</span><span id="score_line-46"><a href="#score_line-46"><span class="linenos">46</span></a>            <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">line</span> <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">j</span><span class="p">],</span> <span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">line</span><span class="p">)</span>
+</span><span id="score_line-47"><a href="#score_line-47"><span class="linenos">47</span></a>    <span class="n">out_struct</span><span class="p">[</span><span class="s1">&#39;row_entropy&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">compute_entropy_avg</span><span class="p">(</span><span class="n">line</span><span class="p">)</span>
+</span><span id="score_line-48"><a href="#score_line-48"><span class="linenos">48</span></a>    <span class="k">return</span> <span class="n">out_struct</span>
+</span></pre></div>
+
+
+    
+
+                </section>
+                <section id="outrank_task_rank_instances">
+                            <input id="outrank_task_rank_instances-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">outrank_task_rank_instances</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">args</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="kc">None</span>:</span></span>
+
+                <label class="view-source-button" for="outrank_task_rank_instances-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#outrank_task_rank_instances"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="outrank_task_rank_instances-51"><a href="#outrank_task_rank_instances-51"><span class="linenos"> 51</span></a><span class="k">def</span> <span class="nf">outrank_task_rank_instances</span><span class="p">(</span><span class="n">args</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="outrank_task_rank_instances-52"><a href="#outrank_task_rank_instances-52"><span class="linenos"> 52</span></a>
+</span><span id="outrank_task_rank_instances-53"><a href="#outrank_task_rank_instances-53"><span class="linenos"> 53</span></a>    <span class="n">data_encoding</span> <span class="o">=</span> <span class="s1">&#39;utf-8&#39;</span>
+</span><span id="outrank_task_rank_instances-54"><a href="#outrank_task_rank_instances-54"><span class="linenos"> 54</span></a>    <span class="n">delimiter</span> <span class="o">=</span> <span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span>
+</span><span id="outrank_task_rank_instances-55"><a href="#outrank_task_rank_instances-55"><span class="linenos"> 55</span></a>    <span class="n">dataset_info</span> <span class="o">=</span> <span class="n">get_dataset_info</span><span class="p">(</span><span class="n">args</span><span class="p">)</span>
+</span><span id="outrank_task_rank_instances-56"><a href="#outrank_task_rank_instances-56"><span class="linenos"> 56</span></a>    <span class="n">local_pbar</span> <span class="o">=</span> <span class="n">tqdm</span><span class="o">.</span><span class="n">tqdm</span><span class="p">(</span>
+</span><span id="outrank_task_rank_instances-57"><a href="#outrank_task_rank_instances-57"><span class="linenos"> 57</span></a>        <span class="n">total</span><span class="o">=</span><span class="n">get_num_of_instances</span><span class="p">(</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">data_path</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="outrank_task_rank_instances-58"><a href="#outrank_task_rank_instances-58"><span class="linenos"> 58</span></a>        <span class="n">position</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="outrank_task_rank_instances-59"><a href="#outrank_task_rank_instances-59"><span class="linenos"> 59</span></a>        <span class="n">disable</span><span class="o">=</span><span class="n">args</span><span class="o">.</span><span class="n">disable_tqdm</span> <span class="o">==</span> <span class="s1">&#39;True&#39;</span><span class="p">,</span>
+</span><span id="outrank_task_rank_instances-60"><a href="#outrank_task_rank_instances-60"><span class="linenos"> 60</span></a>    <span class="p">)</span>
+</span><span id="outrank_task_rank_instances-61"><a href="#outrank_task_rank_instances-61"><span class="linenos"> 61</span></a>    <span class="n">local_pbar</span><span class="o">.</span><span class="n">set_description</span><span class="p">(</span><span class="s1">&#39;Starting ranking computation&#39;</span><span class="p">)</span>
+</span><span id="outrank_task_rank_instances-62"><a href="#outrank_task_rank_instances-62"><span class="linenos"> 62</span></a>
+</span><span id="outrank_task_rank_instances-63"><a href="#outrank_task_rank_instances-63"><span class="linenos"> 63</span></a>    <span class="n">_</span><span class="p">,</span> <span class="n">file_extension</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">splitext</span><span class="p">(</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">data_path</span><span class="p">)</span>
+</span><span id="outrank_task_rank_instances-64"><a href="#outrank_task_rank_instances-64"><span class="linenos"> 64</span></a>
+</span><span id="outrank_task_rank_instances-65"><a href="#outrank_task_rank_instances-65"><span class="linenos"> 65</span></a>    <span class="k">if</span> <span class="n">file_extension</span> <span class="o">==</span> <span class="s1">&#39;.gz&#39;</span><span class="p">:</span>
+</span><span id="outrank_task_rank_instances-66"><a href="#outrank_task_rank_instances-66"><span class="linenos"> 66</span></a>        <span class="n">file_stream</span> <span class="o">=</span> <span class="n">gzip</span><span class="o">.</span><span class="n">open</span><span class="p">(</span>
+</span><span id="outrank_task_rank_instances-67"><a href="#outrank_task_rank_instances-67"><span class="linenos"> 67</span></a>            <span class="n">dataset_info</span><span class="o">.</span><span class="n">data_path</span><span class="p">,</span>
+</span><span id="outrank_task_rank_instances-68"><a href="#outrank_task_rank_instances-68"><span class="linenos"> 68</span></a>            <span class="s1">&#39;rt&#39;</span><span class="p">,</span>
+</span><span id="outrank_task_rank_instances-69"><a href="#outrank_task_rank_instances-69"><span class="linenos"> 69</span></a>            <span class="n">encoding</span><span class="o">=</span><span class="n">data_encoding</span><span class="p">,</span>
+</span><span id="outrank_task_rank_instances-70"><a href="#outrank_task_rank_instances-70"><span class="linenos"> 70</span></a>        <span class="p">)</span>
+</span><span id="outrank_task_rank_instances-71"><a href="#outrank_task_rank_instances-71"><span class="linenos"> 71</span></a>
+</span><span id="outrank_task_rank_instances-72"><a href="#outrank_task_rank_instances-72"><span class="linenos"> 72</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="outrank_task_rank_instances-73"><a href="#outrank_task_rank_instances-73"><span class="linenos"> 73</span></a>        <span class="n">file_stream</span> <span class="o">=</span> <span class="nb">open</span><span class="p">(</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">data_path</span><span class="p">,</span> <span class="n">encoding</span><span class="o">=</span><span class="n">data_encoding</span><span class="p">)</span>
+</span><span id="outrank_task_rank_instances-74"><a href="#outrank_task_rank_instances-74"><span class="linenos"> 74</span></a>    <span class="n">line_counter</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="outrank_task_rank_instances-75"><a href="#outrank_task_rank_instances-75"><span class="linenos"> 75</span></a>    <span class="n">out_scores_lab</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
+</span><span id="outrank_task_rank_instances-76"><a href="#outrank_task_rank_instances-76"><span class="linenos"> 76</span></a>
+</span><span id="outrank_task_rank_instances-77"><a href="#outrank_task_rank_instances-77"><span class="linenos"> 77</span></a>    <span class="k">for</span> <span class="n">line</span> <span class="ow">in</span> <span class="n">file_stream</span><span class="p">:</span>
+</span><span id="outrank_task_rank_instances-78"><a href="#outrank_task_rank_instances-78"><span class="linenos"> 78</span></a>        <span class="n">line_counter</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="outrank_task_rank_instances-79"><a href="#outrank_task_rank_instances-79"><span class="linenos"> 79</span></a>        <span class="n">local_pbar</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="outrank_task_rank_instances-80"><a href="#outrank_task_rank_instances-80"><span class="linenos"> 80</span></a>
+</span><span id="outrank_task_rank_instances-81"><a href="#outrank_task_rank_instances-81"><span class="linenos"> 81</span></a>        <span class="n">parsed_line</span> <span class="o">=</span> <span class="n">generic_line_parser</span><span class="p">(</span>
+</span><span id="outrank_task_rank_instances-82"><a href="#outrank_task_rank_instances-82"><span class="linenos"> 82</span></a>            <span class="n">line</span><span class="p">,</span>
+</span><span id="outrank_task_rank_instances-83"><a href="#outrank_task_rank_instances-83"><span class="linenos"> 83</span></a>            <span class="n">delimiter</span><span class="p">,</span>
+</span><span id="outrank_task_rank_instances-84"><a href="#outrank_task_rank_instances-84"><span class="linenos"> 84</span></a>            <span class="n">args</span><span class="p">,</span>
+</span><span id="outrank_task_rank_instances-85"><a href="#outrank_task_rank_instances-85"><span class="linenos"> 85</span></a>            <span class="n">dataset_info</span><span class="o">.</span><span class="n">fw_map</span><span class="p">,</span>
+</span><span id="outrank_task_rank_instances-86"><a href="#outrank_task_rank_instances-86"><span class="linenos"> 86</span></a>            <span class="n">dataset_info</span><span class="o">.</span><span class="n">column_names</span><span class="p">,</span>
+</span><span id="outrank_task_rank_instances-87"><a href="#outrank_task_rank_instances-87"><span class="linenos"> 87</span></a>        <span class="p">)</span>
+</span><span id="outrank_task_rank_instances-88"><a href="#outrank_task_rank_instances-88"><span class="linenos"> 88</span></a>
+</span><span id="outrank_task_rank_instances-89"><a href="#outrank_task_rank_instances-89"><span class="linenos"> 89</span></a>        <span class="k">if</span> <span class="n">line_counter</span> <span class="o">&gt;</span> <span class="mi">100_000</span><span class="p">:</span>
+</span><span id="outrank_task_rank_instances-90"><a href="#outrank_task_rank_instances-90"><span class="linenos"> 90</span></a>            <span class="k">break</span>
+</span><span id="outrank_task_rank_instances-91"><a href="#outrank_task_rank_instances-91"><span class="linenos"> 91</span></a>        <span class="n">out_scores_lab</span><span class="p">[</span><span class="n">line</span><span class="p">[</span><span class="mi">0</span><span class="p">]]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">score_line</span><span class="p">(</span><span class="n">parsed_line</span><span class="p">))</span>
+</span><span id="outrank_task_rank_instances-92"><a href="#outrank_task_rank_instances-92"><span class="linenos"> 92</span></a>
+</span><span id="outrank_task_rank_instances-93"><a href="#outrank_task_rank_instances-93"><span class="linenos"> 93</span></a>    <span class="k">for</span> <span class="n">label</span><span class="p">,</span> <span class="n">out_scores</span> <span class="ow">in</span> <span class="n">out_scores_lab</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="outrank_task_rank_instances-94"><a href="#outrank_task_rank_instances-94"><span class="linenos"> 94</span></a>        <span class="n">out_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">out_scores</span><span class="p">)</span>
+</span><span id="outrank_task_rank_instances-95"><a href="#outrank_task_rank_instances-95"><span class="linenos"> 95</span></a>        <span class="n">os</span><span class="o">.</span><span class="n">makedirs</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="p">,</span> <span class="n">exist_ok</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="outrank_task_rank_instances-96"><a href="#outrank_task_rank_instances-96"><span class="linenos"> 96</span></a>        <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">out_df</span><span class="o">.</span><span class="n">columns</span><span class="p">:</span>
+</span><span id="outrank_task_rank_instances-97"><a href="#outrank_task_rank_instances-97"><span class="linenos"> 97</span></a>            <span class="n">sorted_vals</span> <span class="o">=</span> <span class="n">out_df</span><span class="p">[</span><span class="n">col</span><span class="p">]</span><span class="o">.</span><span class="n">sort_values</span><span class="p">()</span>
+</span><span id="outrank_task_rank_instances-98"><a href="#outrank_task_rank_instances-98"><span class="linenos"> 98</span></a>            <span class="n">plt</span><span class="o">.</span><span class="n">figure</span><span class="p">(</span><span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">5</span><span class="p">,</span> <span class="mi">5</span><span class="p">),</span> <span class="n">dpi</span><span class="o">=</span><span class="mi">300</span><span class="p">)</span>
+</span><span id="outrank_task_rank_instances-99"><a href="#outrank_task_rank_instances-99"><span class="linenos"> 99</span></a>            <span class="n">plt</span><span class="o">.</span><span class="n">title</span><span class="p">(</span><span class="n">col</span> <span class="o">+</span> <span class="sa">f</span><span class="s1">&#39; label: </span><span class="si">{</span><span class="n">label</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="outrank_task_rank_instances-100"><a href="#outrank_task_rank_instances-100"><span class="linenos">100</span></a>            <span class="n">plt</span><span class="o">.</span><span class="n">hist</span><span class="p">(</span>
+</span><span id="outrank_task_rank_instances-101"><a href="#outrank_task_rank_instances-101"><span class="linenos">101</span></a>                <span class="n">x</span><span class="o">=</span><span class="n">sorted_vals</span> <span class="o">*</span> <span class="mi">100</span><span class="p">,</span>
+</span><span id="outrank_task_rank_instances-102"><a href="#outrank_task_rank_instances-102"><span class="linenos">102</span></a>                <span class="n">color</span><span class="o">=</span><span class="s1">&#39;black&#39;</span><span class="p">,</span>
+</span><span id="outrank_task_rank_instances-103"><a href="#outrank_task_rank_instances-103"><span class="linenos">103</span></a>                <span class="n">density</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+</span><span id="outrank_task_rank_instances-104"><a href="#outrank_task_rank_instances-104"><span class="linenos">104</span></a>                <span class="n">bins</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span>
+</span><span id="outrank_task_rank_instances-105"><a href="#outrank_task_rank_instances-105"><span class="linenos">105</span></a>            <span class="p">)</span>
+</span><span id="outrank_task_rank_instances-106"><a href="#outrank_task_rank_instances-106"><span class="linenos">106</span></a>            <span class="k">if</span> <span class="s1">&#39;entropy&#39;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">col</span><span class="p">:</span>
+</span><span id="outrank_task_rank_instances-107"><a href="#outrank_task_rank_instances-107"><span class="linenos">107</span></a>                <span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s1">&#39;Proportion of namespaces (%)&#39;</span><span class="p">)</span>
+</span><span id="outrank_task_rank_instances-108"><a href="#outrank_task_rank_instances-108"><span class="linenos">108</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="outrank_task_rank_instances-109"><a href="#outrank_task_rank_instances-109"><span class="linenos">109</span></a>                <span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s1">&#39;Row entropy&#39;</span><span class="p">)</span>
+</span><span id="outrank_task_rank_instances-110"><a href="#outrank_task_rank_instances-110"><span class="linenos">110</span></a>            <span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="s1">&#39;Density&#39;</span><span class="p">)</span>
+</span><span id="outrank_task_rank_instances-111"><a href="#outrank_task_rank_instances-111"><span class="linenos">111</span></a>            <span class="n">plt</span><span class="o">.</span><span class="n">tight_layout</span><span class="p">()</span>
+</span><span id="outrank_task_rank_instances-112"><a href="#outrank_task_rank_instances-112"><span class="linenos">112</span></a>            <span class="n">fname</span> <span class="o">=</span> <span class="sa">f</span><span class="s1">&#39;distPlot</span><span class="si">{</span><span class="n">col</span><span class="si">}</span><span class="s1">_</span><span class="si">{</span><span class="n">label</span><span class="si">}</span><span class="s1">.pdf&#39;</span>
+</span><span id="outrank_task_rank_instances-113"><a href="#outrank_task_rank_instances-113"><span class="linenos">113</span></a>            <span class="n">plt</span><span class="o">.</span><span class="n">savefig</span><span class="p">(</span><span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="p">,</span> <span class="n">fname</span><span class="p">),</span> <span class="n">dpi</span><span class="o">=</span><span class="mi">300</span><span class="p">)</span>
+</span><span id="outrank_task_rank_instances-114"><a href="#outrank_task_rank_instances-114"><span class="linenos">114</span></a>            <span class="n">plt</span><span class="o">.</span><span class="n">cla</span><span class="p">()</span>
+</span><span id="outrank_task_rank_instances-115"><a href="#outrank_task_rank_instances-115"><span class="linenos">115</span></a>            <span class="n">plt</span><span class="o">.</span><span class="n">clf</span><span class="p">()</span>
+</span></pre></div>
+
+
+    
+
+                </section>
+    </main>
+<script>
+    function escapeHTML(html) {
+        return document.createElement('div').appendChild(document.createTextNode(html)).parentNode.innerHTML;
+    }
+
+    const originalContent = document.querySelector("main.pdoc");
+    let currentContent = originalContent;
+
+    function setContent(innerHTML) {
+        let elem;
+        if (innerHTML) {
+            elem = document.createElement("main");
+            elem.classList.add("pdoc");
+            elem.innerHTML = innerHTML;
+        } else {
+            elem = originalContent;
+        }
+        if (currentContent !== elem) {
+            currentContent.replaceWith(elem);
+            currentContent = elem;
+        }
+    }
+
+    function getSearchTerm() {
+        return (new URL(window.location)).searchParams.get("search");
+    }
+
+    const searchBox = document.querySelector(".pdoc input[type=search]");
+    searchBox.addEventListener("input", function () {
+        let url = new URL(window.location);
+        if (searchBox.value.trim()) {
+            url.hash = "";
+            url.searchParams.set("search", searchBox.value);
+        } else {
+            url.searchParams.delete("search");
+        }
+        history.replaceState("", "", url.toString());
+        onInput();
+    });
+    window.addEventListener("popstate", onInput);
+
+
+    let search, searchErr;
+
+    async function initialize() {
+        try {
+            search = await new Promise((resolve, reject) => {
+                const script = document.createElement("script");
+                script.type = "text/javascript";
+                script.async = true;
+                script.onload = () => resolve(window.pdocSearch);
+                script.onerror = (e) => reject(e);
+                script.src = "../search.js";
+                document.getElementsByTagName("head")[0].appendChild(script);
+            });
+        } catch (e) {
+            console.error("Cannot fetch pdoc search index");
+            searchErr = "Cannot fetch search index.";
+        }
+        onInput();
+
+        document.querySelector("nav.pdoc").addEventListener("click", e => {
+            if (e.target.hash) {
+                searchBox.value = "";
+                searchBox.dispatchEvent(new Event("input"));
+            }
+        });
+    }
+
+    function onInput() {
+        setContent((() => {
+            const term = getSearchTerm();
+            if (!term) {
+                return null
+            }
+            if (searchErr) {
+                return `<h3>Error: ${searchErr}</h3>`
+            }
+            if (!search) {
+                return "<h3>Searching...</h3>"
+            }
+
+            window.scrollTo({top: 0, left: 0, behavior: 'auto'});
+
+            const results = search(term);
+
+            let html;
+            if (results.length === 0) {
+                html = `No search results for '${escapeHTML(term)}'.`
+            } else {
+                html = `<h4>${results.length} search result${results.length > 1 ? "s" : ""} for '${escapeHTML(term)}'.</h4>`;
+            }
+            for (let result of results.slice(0, 10)) {
+                let doc = result.doc;
+                let url = `../${doc.modulename.replaceAll(".", "/")}.html`;
+                if (doc.qualname) {
+                    url += `#${doc.qualname}`;
+                }
+
+                let heading;
+                switch (result.doc.kind) {
+                    case "function":
+                        if (doc.fullname.endsWith(".__init__")) {
+                            heading = `<span class="name">${doc.fullname.replace(/\.__init__$/, "")}</span>${doc.signature}`;
+                        } else {
+                            heading = `<span class="def">${doc.funcdef}</span> <span class="name">${doc.fullname}</span>${doc.signature}`;
+                        }
+                        break;
+                    case "class":
+                        heading = `<span class="def">class</span> <span class="name">${doc.fullname}</span>`;
+                        if (doc.bases)
+                            heading += `<wbr>(<span class="base">${doc.bases}</span>)`;
+                        heading += `:`;
+                        break;
+                    case "variable":
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        if (doc.annotation)
+                            heading += `<span class="annotation">${doc.annotation}</span>`;
+                        if (doc.default_value)
+                            heading += `<span class="default_value"> = ${doc.default_value}</span>`;
+                        break;
+                    default:
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        break;
+                }
+                html += `
+                        <section class="search-result">
+                        <a href="${url}" class="attr ${doc.kind}">${heading}</a>
+                        <div class="docstring">${doc.doc}</div>
+                        </section>
+                    `;
+
+            }
+            return html;
+        })());
+    }
+
+    if (getSearchTerm()) {
+        initialize();
+        searchBox.value = getSearchTerm();
+        onInput();
+    } else {
+        searchBox.addEventListener("focus", initialize, {once: true});
+    }
+
+    searchBox.addEventListener("keydown", e => {
+        if (["ArrowDown", "ArrowUp", "Enter"].includes(e.key)) {
+            let focused = currentContent.querySelector(".search-result.focused");
+            if (!focused) {
+                currentContent.querySelector(".search-result").classList.add("focused");
+            } else if (
+                e.key === "ArrowDown"
+                && focused.nextElementSibling
+                && focused.nextElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.nextElementSibling.classList.add("focused");
+                focused.nextElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "ArrowUp"
+                && focused.previousElementSibling
+                && focused.previousElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.previousElementSibling.classList.add("focused");
+                focused.previousElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "Enter"
+            ) {
+                focused.querySelector("a").click();
+            }
+        }
+    });
+</script></body>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/task_ranking.html b/docs/outrank/task_ranking.html
index ac5e3a0..f6176a9 100644
--- a/docs/outrank/task_ranking.html
+++ b/docs/outrank/task_ranking.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.task_ranking API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -49,7 +49,7 @@ <h2>API Documentation</h2>
                     <h1 class="modulename">
 <a href="./../outrank.html">outrank</a><wbr>.task_ranking    </h1>
 
-
+                
                         <input id="mod-task_ranking-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 
                         <label class="view-source-button" for="mod-task_ranking-view-source"><span>View Source</span></label>
@@ -362,7 +362,7 @@ <h1 class="modulename">
                 <section id="outrank_task_conduct_ranking">
                             <input id="outrank_task_conduct_ranking-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">outrank_task_conduct_ranking</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">args</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="kc">None</span>:</span></span>
 
@@ -640,7 +640,7 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                 </section>
     </main>
@@ -826,4 +826,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/task_selftest.html b/docs/outrank/task_selftest.html
index f36e78e..cbbfeb9 100644
--- a/docs/outrank/task_selftest.html
+++ b/docs/outrank/task_selftest.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.task_selftest API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -52,7 +52,7 @@ <h2>API Documentation</h2>
                     <h1 class="modulename">
 <a href="./../outrank.html">outrank</a><wbr>.task_selftest    </h1>
 
-
+                
                         <input id="mod-task_selftest-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 
                         <label class="view-source-button" for="mod-task_selftest-view-source"><span>View Source</span></label>
@@ -81,16 +81,16 @@ <h1 class="modulename">
 </span><span id="L-22"><a href="#L-22"><span class="linenos">22</span></a>        <span class="s1">&#39;outrank --task data_generator --num_synthetic_rows 100000&#39;</span><span class="p">,</span> <span class="n">shell</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
 </span><span id="L-23"><a href="#L-23"><span class="linenos">23</span></a>    <span class="p">)</span>
 </span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a>    <span class="n">subprocess</span><span class="o">.</span><span class="n">run</span><span class="p">(</span>
-</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a>        <span class="s1">&#39;outrank --task ranking --data_path test_data_synthetic --data_source csv-raw --combination_number_upper_bound 60;&#39;</span><span class="p">,</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a>        <span class="s1">&#39;outrank --task ranking --data_path test_data_synthetic --data_source csv-raw;&#39;</span><span class="p">,</span>
 </span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a>        <span class="n">shell</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
 </span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a>    <span class="p">)</span>
 </span><span id="L-28"><a href="#L-28"><span class="linenos">28</span></a>
 </span><span id="L-29"><a href="#L-29"><span class="linenos">29</span></a>    <span class="n">dfx</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">read_csv</span><span class="p">(</span><span class="s1">&#39;ranking_outputs/pairwise_ranks.tsv&#39;</span><span class="p">,</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">)</span>
 </span><span id="L-30"><a href="#L-30"><span class="linenos">30</span></a>
 </span><span id="L-31"><a href="#L-31"><span class="linenos">31</span></a>    <span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Verifying output&#39;s properties ..&quot;</span><span class="p">)</span>
-</span><span id="L-32"><a href="#L-32"><span class="linenos">32</span></a>    <span class="k">assert</span> <span class="n">dfx</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="mi">120</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos">32</span></a>    <span class="k">assert</span> <span class="n">dfx</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="mi">201</span>
 </span><span id="L-33"><a href="#L-33"><span class="linenos">33</span></a>    <span class="k">assert</span> <span class="n">dfx</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">==</span> <span class="mi">3</span>
-</span><span id="L-34"><a href="#L-34"><span class="linenos">34</span></a>    <span class="k">assert</span> <span class="n">dfx</span><span class="p">[</span><span class="s1">&#39;FeatureA&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span><span class="o">.</span><span class="n">pop</span><span class="p">()</span> <span class="o">==</span> <span class="s1">&#39;label-(81; 100)&#39;</span> <span class="ow">or</span> <span class="n">dfx</span><span class="p">[</span><span class="s1">&#39;FeatureB&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span><span class="o">.</span><span class="n">pop</span><span class="p">()</span> <span class="o">==</span> <span class="s1">&#39;label-(81; 100)&#39;</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos">34</span></a>    <span class="k">assert</span> <span class="n">dfx</span><span class="p">[</span><span class="s1">&#39;FeatureA&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span><span class="o">.</span><span class="n">pop</span><span class="p">()</span> <span class="o">==</span> <span class="s1">&#39;label-(2; 100)&#39;</span> <span class="ow">or</span> <span class="n">dfx</span><span class="p">[</span><span class="s1">&#39;FeatureB&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span><span class="o">.</span><span class="n">pop</span><span class="p">()</span> <span class="o">==</span> <span class="s1">&#39;label-(2; 100)&#39;</span>
 </span><span id="L-35"><a href="#L-35"><span class="linenos">35</span></a>
 </span><span id="L-36"><a href="#L-36"><span class="linenos">36</span></a>    <span class="n">to_remove</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;ranking_outputs&#39;</span><span class="p">,</span> <span class="s1">&#39;test_data_synthetic&#39;</span><span class="p">]</span>
 </span><span id="L-37"><a href="#L-37"><span class="linenos">37</span></a>    <span class="k">for</span> <span class="n">path</span> <span class="ow">in</span> <span class="n">to_remove</span><span class="p">:</span>
@@ -99,6 +99,10 @@ <h1 class="modulename">
 </span><span id="L-40"><a href="#L-40"><span class="linenos">40</span></a>            <span class="n">shutil</span><span class="o">.</span><span class="n">rmtree</span><span class="p">(</span><span class="n">path</span><span class="p">)</span>
 </span><span id="L-41"><a href="#L-41"><span class="linenos">41</span></a>
 </span><span id="L-42"><a href="#L-42"><span class="linenos">42</span></a>    <span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s1">&#39;All tests passed, OutRank seems in shape </span><span class="se">\N{winking face}</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos">43</span></a>
+</span><span id="L-44"><a href="#L-44"><span class="linenos">44</span></a>
+</span><span id="L-45"><a href="#L-45"><span class="linenos">45</span></a><span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s1">&#39;__main__&#39;</span><span class="p">:</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos">46</span></a>    <span class="n">conduct_self_test</span><span class="p">()</span>
 </span></pre></div>
 
 
@@ -108,17 +112,17 @@ <h1 class="modulename">
             <span class="name">logger</span>        =
 <span class="default_value">&lt;Logger syn-logger (DEBUG)&gt;</span>
 
-
+        
     </div>
     <a class="headerlink" href="#logger"></a>
-
-
+    
+    
 
                 </section>
                 <section id="conduct_self_test">
                             <input id="conduct_self_test-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">conduct_self_test</span><span class="signature pdoc-code condensed">(<span class="return-annotation">):</span></span>
 
@@ -132,16 +136,16 @@ <h1 class="modulename">
 </span><span id="conduct_self_test-23"><a href="#conduct_self_test-23"><span class="linenos">23</span></a>        <span class="s1">&#39;outrank --task data_generator --num_synthetic_rows 100000&#39;</span><span class="p">,</span> <span class="n">shell</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
 </span><span id="conduct_self_test-24"><a href="#conduct_self_test-24"><span class="linenos">24</span></a>    <span class="p">)</span>
 </span><span id="conduct_self_test-25"><a href="#conduct_self_test-25"><span class="linenos">25</span></a>    <span class="n">subprocess</span><span class="o">.</span><span class="n">run</span><span class="p">(</span>
-</span><span id="conduct_self_test-26"><a href="#conduct_self_test-26"><span class="linenos">26</span></a>        <span class="s1">&#39;outrank --task ranking --data_path test_data_synthetic --data_source csv-raw --combination_number_upper_bound 60;&#39;</span><span class="p">,</span>
+</span><span id="conduct_self_test-26"><a href="#conduct_self_test-26"><span class="linenos">26</span></a>        <span class="s1">&#39;outrank --task ranking --data_path test_data_synthetic --data_source csv-raw;&#39;</span><span class="p">,</span>
 </span><span id="conduct_self_test-27"><a href="#conduct_self_test-27"><span class="linenos">27</span></a>        <span class="n">shell</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
 </span><span id="conduct_self_test-28"><a href="#conduct_self_test-28"><span class="linenos">28</span></a>    <span class="p">)</span>
 </span><span id="conduct_self_test-29"><a href="#conduct_self_test-29"><span class="linenos">29</span></a>
 </span><span id="conduct_self_test-30"><a href="#conduct_self_test-30"><span class="linenos">30</span></a>    <span class="n">dfx</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">read_csv</span><span class="p">(</span><span class="s1">&#39;ranking_outputs/pairwise_ranks.tsv&#39;</span><span class="p">,</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">)</span>
 </span><span id="conduct_self_test-31"><a href="#conduct_self_test-31"><span class="linenos">31</span></a>
 </span><span id="conduct_self_test-32"><a href="#conduct_self_test-32"><span class="linenos">32</span></a>    <span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Verifying output&#39;s properties ..&quot;</span><span class="p">)</span>
-</span><span id="conduct_self_test-33"><a href="#conduct_self_test-33"><span class="linenos">33</span></a>    <span class="k">assert</span> <span class="n">dfx</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="mi">120</span>
+</span><span id="conduct_self_test-33"><a href="#conduct_self_test-33"><span class="linenos">33</span></a>    <span class="k">assert</span> <span class="n">dfx</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="mi">201</span>
 </span><span id="conduct_self_test-34"><a href="#conduct_self_test-34"><span class="linenos">34</span></a>    <span class="k">assert</span> <span class="n">dfx</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">==</span> <span class="mi">3</span>
-</span><span id="conduct_self_test-35"><a href="#conduct_self_test-35"><span class="linenos">35</span></a>    <span class="k">assert</span> <span class="n">dfx</span><span class="p">[</span><span class="s1">&#39;FeatureA&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span><span class="o">.</span><span class="n">pop</span><span class="p">()</span> <span class="o">==</span> <span class="s1">&#39;label-(81; 100)&#39;</span> <span class="ow">or</span> <span class="n">dfx</span><span class="p">[</span><span class="s1">&#39;FeatureB&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span><span class="o">.</span><span class="n">pop</span><span class="p">()</span> <span class="o">==</span> <span class="s1">&#39;label-(81; 100)&#39;</span>
+</span><span id="conduct_self_test-35"><a href="#conduct_self_test-35"><span class="linenos">35</span></a>    <span class="k">assert</span> <span class="n">dfx</span><span class="p">[</span><span class="s1">&#39;FeatureA&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span><span class="o">.</span><span class="n">pop</span><span class="p">()</span> <span class="o">==</span> <span class="s1">&#39;label-(2; 100)&#39;</span> <span class="ow">or</span> <span class="n">dfx</span><span class="p">[</span><span class="s1">&#39;FeatureB&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span><span class="o">.</span><span class="n">pop</span><span class="p">()</span> <span class="o">==</span> <span class="s1">&#39;label-(2; 100)&#39;</span>
 </span><span id="conduct_self_test-36"><a href="#conduct_self_test-36"><span class="linenos">36</span></a>
 </span><span id="conduct_self_test-37"><a href="#conduct_self_test-37"><span class="linenos">37</span></a>    <span class="n">to_remove</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;ranking_outputs&#39;</span><span class="p">,</span> <span class="s1">&#39;test_data_synthetic&#39;</span><span class="p">]</span>
 </span><span id="conduct_self_test-38"><a href="#conduct_self_test-38"><span class="linenos">38</span></a>    <span class="k">for</span> <span class="n">path</span> <span class="ow">in</span> <span class="n">to_remove</span><span class="p">:</span>
@@ -153,7 +157,7 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                 </section>
     </main>
@@ -339,4 +343,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/task_summary.html b/docs/outrank/task_summary.html
index 4c65d91..871d1ed 100644
--- a/docs/outrank/task_summary.html
+++ b/docs/outrank/task_summary.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.task_summary API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -49,7 +49,7 @@ <h2>API Documentation</h2>
                     <h1 class="modulename">
 <a href="./../outrank.html">outrank</a><wbr>.task_summary    </h1>
 
-
+                
                         <input id="mod-task_summary-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 
                         <label class="view-source-button" for="mod-task_summary-view-source"><span>View Source</span></label>
@@ -93,43 +93,44 @@ <h1 class="modulename">
 </span><span id="L-37"><a href="#L-37"><span class="linenos">37</span></a>
 </span><span id="L-38"><a href="#L-38"><span class="linenos">38</span></a>    <span class="n">min_score</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">(</span><span class="n">final_df</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;Score </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">)</span>
 </span><span id="L-39"><a href="#L-39"><span class="linenos">39</span></a>    <span class="n">max_score</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">final_df</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;Score </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">)</span>
-</span><span id="L-40"><a href="#L-40"><span class="linenos">40</span></a>    <span class="n">final_df</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;Score </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="L-41"><a href="#L-41"><span class="linenos">41</span></a>        <span class="n">final_df</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;Score </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span> <span class="o">-</span> <span class="n">min_score</span>
-</span><span id="L-42"><a href="#L-42"><span class="linenos">42</span></a>    <span class="p">)</span> <span class="o">/</span> <span class="p">(</span><span class="n">max_score</span> <span class="o">-</span> <span class="n">min_score</span><span class="p">)</span>
-</span><span id="L-43"><a href="#L-43"><span class="linenos">43</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Storing summary files to </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="L-44"><a href="#L-44"><span class="linenos">44</span></a>    <span class="n">pd</span><span class="o">.</span><span class="n">set_option</span><span class="p">(</span><span class="s1">&#39;display.max_rows&#39;</span><span class="p">,</span> <span class="kc">None</span><span class="p">,</span> <span class="s1">&#39;display.max_columns&#39;</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="L-45"><a href="#L-45"><span class="linenos">45</span></a>    <span class="n">singles_path</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="p">,</span> <span class="s1">&#39;feature_singles.tsv&#39;</span><span class="p">)</span>
-</span><span id="L-46"><a href="#L-46"><span class="linenos">46</span></a>    <span class="n">final_df</span> <span class="o">=</span> <span class="n">final_df</span><span class="o">.</span><span class="n">reset_index</span><span class="p">(</span><span class="n">drop</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="L-47"><a href="#L-47"><span class="linenos">47</span></a>    <span class="n">final_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span><span class="n">singles_path</span><span class="p">,</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="L-48"><a href="#L-48"><span class="linenos">48</span></a>
-</span><span id="L-49"><a href="#L-49"><span class="linenos">49</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="L-50"><a href="#L-50"><span class="linenos">50</span></a>        <span class="n">feature_store</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
-</span><span id="L-51"><a href="#L-51"><span class="linenos">51</span></a>        <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">final_df</span><span class="o">.</span><span class="n">iterrows</span><span class="p">():</span>
-</span><span id="L-52"><a href="#L-52"><span class="linenos">52</span></a>            <span class="n">fname</span> <span class="o">=</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Feature&#39;</span><span class="p">]</span>
-</span><span id="L-53"><a href="#L-53"><span class="linenos">53</span></a>            <span class="n">score</span> <span class="o">=</span> <span class="n">row</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;Score </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span>
-</span><span id="L-54"><a href="#L-54"><span class="linenos">54</span></a>            <span class="k">if</span> <span class="s1">&#39;AND&#39;</span> <span class="ow">in</span> <span class="n">fname</span><span class="p">:</span>
-</span><span id="L-55"><a href="#L-55"><span class="linenos">55</span></a>                <span class="k">for</span> <span class="n">el</span> <span class="ow">in</span> <span class="n">fname</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;-&#39;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39; AND &#39;</span><span class="p">):</span>
-</span><span id="L-56"><a href="#L-56"><span class="linenos">56</span></a>                    <span class="n">feature_store</span><span class="p">[</span><span class="n">el</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">score</span><span class="p">)</span>
-</span><span id="L-57"><a href="#L-57"><span class="linenos">57</span></a>
-</span><span id="L-58"><a href="#L-58"><span class="linenos">58</span></a>        <span class="n">final_aggregate_df</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-59"><a href="#L-59"><span class="linenos">59</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">feature_store</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="L-60"><a href="#L-60"><span class="linenos">60</span></a>            <span class="n">final_aggregate_df</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-</span><span id="L-61"><a href="#L-61"><span class="linenos">61</span></a>                <span class="p">{</span>
-</span><span id="L-62"><a href="#L-62"><span class="linenos">62</span></a>                    <span class="s1">&#39;Feature&#39;</span><span class="p">:</span> <span class="n">k</span><span class="p">,</span>
-</span><span id="L-63"><a href="#L-63"><span class="linenos">63</span></a>                    <span class="sa">f</span><span class="s1">&#39;Combined score (order: </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span><span class="si">}</span><span class="s1">, </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">)&#39;</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span>
-</span><span id="L-64"><a href="#L-64"><span class="linenos">64</span></a>                        <span class="n">v</span><span class="p">,</span>
-</span><span id="L-65"><a href="#L-65"><span class="linenos">65</span></a>                    <span class="p">),</span>
-</span><span id="L-66"><a href="#L-66"><span class="linenos">66</span></a>                <span class="p">},</span>
-</span><span id="L-67"><a href="#L-67"><span class="linenos">67</span></a>            <span class="p">)</span>
-</span><span id="L-68"><a href="#L-68"><span class="linenos">68</span></a>        <span class="n">final_aggregate_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">final_aggregate_df</span><span class="p">)</span>
-</span><span id="L-69"><a href="#L-69"><span class="linenos">69</span></a>        <span class="n">final_aggregate_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span>
-</span><span id="L-70"><a href="#L-70"><span class="linenos">70</span></a>            <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="p">,</span> <span class="s1">&#39;feature_singles_aggregated.tsv&#39;</span><span class="p">),</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="L-71"><a href="#L-71"><span class="linenos">71</span></a>        <span class="p">)</span>
-</span><span id="L-72"><a href="#L-72"><span class="linenos">72</span></a>
-</span><span id="L-73"><a href="#L-73"><span class="linenos">73</span></a>    <span class="n">final_df</span> <span class="o">=</span> <span class="n">final_df</span><span class="p">[</span><span class="n">final_df</span><span class="p">[</span><span class="s1">&#39;Feature&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">str</span><span class="o">.</span><span class="n">contains</span><span class="p">(</span><span class="s1">&#39;_tr_&#39;</span><span class="p">)]</span>
-</span><span id="L-74"><a href="#L-74"><span class="linenos">74</span></a>    <span class="n">final_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span>
-</span><span id="L-75"><a href="#L-75"><span class="linenos">75</span></a>        <span class="n">singles_path</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s1">&#39;.tsv&#39;</span><span class="p">,</span> <span class="s1">&#39;_transformers_only_imp.tsv&#39;</span><span class="p">),</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="L-76"><a href="#L-76"><span class="linenos">76</span></a>    <span class="p">)</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos">40</span></a>    <span class="k">if</span> <span class="s2">&quot;MI&quot;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">:</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos">41</span></a>        <span class="n">final_df</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;Score </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos">42</span></a>            <span class="n">final_df</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;Score </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span> <span class="o">-</span> <span class="n">min_score</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos">43</span></a>        <span class="p">)</span> <span class="o">/</span> <span class="p">(</span><span class="n">max_score</span> <span class="o">-</span> <span class="n">min_score</span><span class="p">)</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos">44</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Storing summary files to </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos">45</span></a>    <span class="n">pd</span><span class="o">.</span><span class="n">set_option</span><span class="p">(</span><span class="s1">&#39;display.max_rows&#39;</span><span class="p">,</span> <span class="kc">None</span><span class="p">,</span> <span class="s1">&#39;display.max_columns&#39;</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos">46</span></a>    <span class="n">singles_path</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="p">,</span> <span class="s1">&#39;feature_singles.tsv&#39;</span><span class="p">)</span>
+</span><span id="L-47"><a href="#L-47"><span class="linenos">47</span></a>    <span class="n">final_df</span> <span class="o">=</span> <span class="n">final_df</span><span class="o">.</span><span class="n">reset_index</span><span class="p">(</span><span class="n">drop</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos">48</span></a>    <span class="n">final_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span><span class="n">singles_path</span><span class="p">,</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="L-49"><a href="#L-49"><span class="linenos">49</span></a>
+</span><span id="L-50"><a href="#L-50"><span class="linenos">50</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="L-51"><a href="#L-51"><span class="linenos">51</span></a>        <span class="n">feature_store</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos">52</span></a>        <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">final_df</span><span class="o">.</span><span class="n">iterrows</span><span class="p">():</span>
+</span><span id="L-53"><a href="#L-53"><span class="linenos">53</span></a>            <span class="n">fname</span> <span class="o">=</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Feature&#39;</span><span class="p">]</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos">54</span></a>            <span class="n">score</span> <span class="o">=</span> <span class="n">row</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;Score </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos">55</span></a>            <span class="k">if</span> <span class="s1">&#39;AND&#39;</span> <span class="ow">in</span> <span class="n">fname</span><span class="p">:</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos">56</span></a>                <span class="k">for</span> <span class="n">el</span> <span class="ow">in</span> <span class="n">fname</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;-&#39;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39; AND &#39;</span><span class="p">):</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos">57</span></a>                    <span class="n">feature_store</span><span class="p">[</span><span class="n">el</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">score</span><span class="p">)</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos">58</span></a>
+</span><span id="L-59"><a href="#L-59"><span class="linenos">59</span></a>        <span class="n">final_aggregate_df</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos">60</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">feature_store</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-61"><a href="#L-61"><span class="linenos">61</span></a>            <span class="n">final_aggregate_df</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos">62</span></a>                <span class="p">{</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos">63</span></a>                    <span class="s1">&#39;Feature&#39;</span><span class="p">:</span> <span class="n">k</span><span class="p">,</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos">64</span></a>                    <span class="sa">f</span><span class="s1">&#39;Combined score (order: </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span><span class="si">}</span><span class="s1">, </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">)&#39;</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos">65</span></a>                        <span class="n">v</span><span class="p">,</span>
+</span><span id="L-66"><a href="#L-66"><span class="linenos">66</span></a>                    <span class="p">),</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos">67</span></a>                <span class="p">},</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos">68</span></a>            <span class="p">)</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos">69</span></a>        <span class="n">final_aggregate_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">final_aggregate_df</span><span class="p">)</span>
+</span><span id="L-70"><a href="#L-70"><span class="linenos">70</span></a>        <span class="n">final_aggregate_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span>
+</span><span id="L-71"><a href="#L-71"><span class="linenos">71</span></a>            <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="p">,</span> <span class="s1">&#39;feature_singles_aggregated.tsv&#39;</span><span class="p">),</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="L-72"><a href="#L-72"><span class="linenos">72</span></a>        <span class="p">)</span>
+</span><span id="L-73"><a href="#L-73"><span class="linenos">73</span></a>
+</span><span id="L-74"><a href="#L-74"><span class="linenos">74</span></a>    <span class="n">final_df</span> <span class="o">=</span> <span class="n">final_df</span><span class="p">[</span><span class="n">final_df</span><span class="p">[</span><span class="s1">&#39;Feature&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">str</span><span class="o">.</span><span class="n">contains</span><span class="p">(</span><span class="s1">&#39;_tr_&#39;</span><span class="p">)]</span>
+</span><span id="L-75"><a href="#L-75"><span class="linenos">75</span></a>    <span class="n">final_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span>
+</span><span id="L-76"><a href="#L-76"><span class="linenos">76</span></a>        <span class="n">singles_path</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s1">&#39;.tsv&#39;</span><span class="p">,</span> <span class="s1">&#39;_transformers_only_imp.tsv&#39;</span><span class="p">),</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="L-77"><a href="#L-77"><span class="linenos">77</span></a>    <span class="p">)</span>
 </span></pre></div>
 
 
@@ -137,7 +138,7 @@ <h1 class="modulename">
                 <section id="outrank_task_result_summary">
                             <input id="outrank_task_result_summary-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">outrank_task_result_summary</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">args</span></span><span class="return-annotation">):</span></span>
 
@@ -172,47 +173,48 @@ <h1 class="modulename">
 </span><span id="outrank_task_result_summary-38"><a href="#outrank_task_result_summary-38"><span class="linenos">38</span></a>
 </span><span id="outrank_task_result_summary-39"><a href="#outrank_task_result_summary-39"><span class="linenos">39</span></a>    <span class="n">min_score</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">(</span><span class="n">final_df</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;Score </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">)</span>
 </span><span id="outrank_task_result_summary-40"><a href="#outrank_task_result_summary-40"><span class="linenos">40</span></a>    <span class="n">max_score</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">final_df</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;Score </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">values</span><span class="p">)</span>
-</span><span id="outrank_task_result_summary-41"><a href="#outrank_task_result_summary-41"><span class="linenos">41</span></a>    <span class="n">final_df</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;Score </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="outrank_task_result_summary-42"><a href="#outrank_task_result_summary-42"><span class="linenos">42</span></a>        <span class="n">final_df</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;Score </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span> <span class="o">-</span> <span class="n">min_score</span>
-</span><span id="outrank_task_result_summary-43"><a href="#outrank_task_result_summary-43"><span class="linenos">43</span></a>    <span class="p">)</span> <span class="o">/</span> <span class="p">(</span><span class="n">max_score</span> <span class="o">-</span> <span class="n">min_score</span><span class="p">)</span>
-</span><span id="outrank_task_result_summary-44"><a href="#outrank_task_result_summary-44"><span class="linenos">44</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Storing summary files to </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="outrank_task_result_summary-45"><a href="#outrank_task_result_summary-45"><span class="linenos">45</span></a>    <span class="n">pd</span><span class="o">.</span><span class="n">set_option</span><span class="p">(</span><span class="s1">&#39;display.max_rows&#39;</span><span class="p">,</span> <span class="kc">None</span><span class="p">,</span> <span class="s1">&#39;display.max_columns&#39;</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
-</span><span id="outrank_task_result_summary-46"><a href="#outrank_task_result_summary-46"><span class="linenos">46</span></a>    <span class="n">singles_path</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="p">,</span> <span class="s1">&#39;feature_singles.tsv&#39;</span><span class="p">)</span>
-</span><span id="outrank_task_result_summary-47"><a href="#outrank_task_result_summary-47"><span class="linenos">47</span></a>    <span class="n">final_df</span> <span class="o">=</span> <span class="n">final_df</span><span class="o">.</span><span class="n">reset_index</span><span class="p">(</span><span class="n">drop</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="outrank_task_result_summary-48"><a href="#outrank_task_result_summary-48"><span class="linenos">48</span></a>    <span class="n">final_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span><span class="n">singles_path</span><span class="p">,</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="outrank_task_result_summary-49"><a href="#outrank_task_result_summary-49"><span class="linenos">49</span></a>
-</span><span id="outrank_task_result_summary-50"><a href="#outrank_task_result_summary-50"><span class="linenos">50</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="outrank_task_result_summary-51"><a href="#outrank_task_result_summary-51"><span class="linenos">51</span></a>        <span class="n">feature_store</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
-</span><span id="outrank_task_result_summary-52"><a href="#outrank_task_result_summary-52"><span class="linenos">52</span></a>        <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">final_df</span><span class="o">.</span><span class="n">iterrows</span><span class="p">():</span>
-</span><span id="outrank_task_result_summary-53"><a href="#outrank_task_result_summary-53"><span class="linenos">53</span></a>            <span class="n">fname</span> <span class="o">=</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Feature&#39;</span><span class="p">]</span>
-</span><span id="outrank_task_result_summary-54"><a href="#outrank_task_result_summary-54"><span class="linenos">54</span></a>            <span class="n">score</span> <span class="o">=</span> <span class="n">row</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;Score </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span>
-</span><span id="outrank_task_result_summary-55"><a href="#outrank_task_result_summary-55"><span class="linenos">55</span></a>            <span class="k">if</span> <span class="s1">&#39;AND&#39;</span> <span class="ow">in</span> <span class="n">fname</span><span class="p">:</span>
-</span><span id="outrank_task_result_summary-56"><a href="#outrank_task_result_summary-56"><span class="linenos">56</span></a>                <span class="k">for</span> <span class="n">el</span> <span class="ow">in</span> <span class="n">fname</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;-&#39;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39; AND &#39;</span><span class="p">):</span>
-</span><span id="outrank_task_result_summary-57"><a href="#outrank_task_result_summary-57"><span class="linenos">57</span></a>                    <span class="n">feature_store</span><span class="p">[</span><span class="n">el</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">score</span><span class="p">)</span>
-</span><span id="outrank_task_result_summary-58"><a href="#outrank_task_result_summary-58"><span class="linenos">58</span></a>
-</span><span id="outrank_task_result_summary-59"><a href="#outrank_task_result_summary-59"><span class="linenos">59</span></a>        <span class="n">final_aggregate_df</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="outrank_task_result_summary-60"><a href="#outrank_task_result_summary-60"><span class="linenos">60</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">feature_store</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="outrank_task_result_summary-61"><a href="#outrank_task_result_summary-61"><span class="linenos">61</span></a>            <span class="n">final_aggregate_df</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-</span><span id="outrank_task_result_summary-62"><a href="#outrank_task_result_summary-62"><span class="linenos">62</span></a>                <span class="p">{</span>
-</span><span id="outrank_task_result_summary-63"><a href="#outrank_task_result_summary-63"><span class="linenos">63</span></a>                    <span class="s1">&#39;Feature&#39;</span><span class="p">:</span> <span class="n">k</span><span class="p">,</span>
-</span><span id="outrank_task_result_summary-64"><a href="#outrank_task_result_summary-64"><span class="linenos">64</span></a>                    <span class="sa">f</span><span class="s1">&#39;Combined score (order: </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span><span class="si">}</span><span class="s1">, </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">)&#39;</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span>
-</span><span id="outrank_task_result_summary-65"><a href="#outrank_task_result_summary-65"><span class="linenos">65</span></a>                        <span class="n">v</span><span class="p">,</span>
-</span><span id="outrank_task_result_summary-66"><a href="#outrank_task_result_summary-66"><span class="linenos">66</span></a>                    <span class="p">),</span>
-</span><span id="outrank_task_result_summary-67"><a href="#outrank_task_result_summary-67"><span class="linenos">67</span></a>                <span class="p">},</span>
-</span><span id="outrank_task_result_summary-68"><a href="#outrank_task_result_summary-68"><span class="linenos">68</span></a>            <span class="p">)</span>
-</span><span id="outrank_task_result_summary-69"><a href="#outrank_task_result_summary-69"><span class="linenos">69</span></a>        <span class="n">final_aggregate_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">final_aggregate_df</span><span class="p">)</span>
-</span><span id="outrank_task_result_summary-70"><a href="#outrank_task_result_summary-70"><span class="linenos">70</span></a>        <span class="n">final_aggregate_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span>
-</span><span id="outrank_task_result_summary-71"><a href="#outrank_task_result_summary-71"><span class="linenos">71</span></a>            <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="p">,</span> <span class="s1">&#39;feature_singles_aggregated.tsv&#39;</span><span class="p">),</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="outrank_task_result_summary-72"><a href="#outrank_task_result_summary-72"><span class="linenos">72</span></a>        <span class="p">)</span>
-</span><span id="outrank_task_result_summary-73"><a href="#outrank_task_result_summary-73"><span class="linenos">73</span></a>
-</span><span id="outrank_task_result_summary-74"><a href="#outrank_task_result_summary-74"><span class="linenos">74</span></a>    <span class="n">final_df</span> <span class="o">=</span> <span class="n">final_df</span><span class="p">[</span><span class="n">final_df</span><span class="p">[</span><span class="s1">&#39;Feature&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">str</span><span class="o">.</span><span class="n">contains</span><span class="p">(</span><span class="s1">&#39;_tr_&#39;</span><span class="p">)]</span>
-</span><span id="outrank_task_result_summary-75"><a href="#outrank_task_result_summary-75"><span class="linenos">75</span></a>    <span class="n">final_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span>
-</span><span id="outrank_task_result_summary-76"><a href="#outrank_task_result_summary-76"><span class="linenos">76</span></a>        <span class="n">singles_path</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s1">&#39;.tsv&#39;</span><span class="p">,</span> <span class="s1">&#39;_transformers_only_imp.tsv&#39;</span><span class="p">),</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
-</span><span id="outrank_task_result_summary-77"><a href="#outrank_task_result_summary-77"><span class="linenos">77</span></a>    <span class="p">)</span>
+</span><span id="outrank_task_result_summary-41"><a href="#outrank_task_result_summary-41"><span class="linenos">41</span></a>    <span class="k">if</span> <span class="s2">&quot;MI&quot;</span> <span class="ow">in</span> <span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="p">:</span>
+</span><span id="outrank_task_result_summary-42"><a href="#outrank_task_result_summary-42"><span class="linenos">42</span></a>        <span class="n">final_df</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;Score </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="outrank_task_result_summary-43"><a href="#outrank_task_result_summary-43"><span class="linenos">43</span></a>            <span class="n">final_df</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;Score </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span> <span class="o">-</span> <span class="n">min_score</span>
+</span><span id="outrank_task_result_summary-44"><a href="#outrank_task_result_summary-44"><span class="linenos">44</span></a>        <span class="p">)</span> <span class="o">/</span> <span class="p">(</span><span class="n">max_score</span> <span class="o">-</span> <span class="n">min_score</span><span class="p">)</span>
+</span><span id="outrank_task_result_summary-45"><a href="#outrank_task_result_summary-45"><span class="linenos">45</span></a>    <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Storing summary files to </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="outrank_task_result_summary-46"><a href="#outrank_task_result_summary-46"><span class="linenos">46</span></a>    <span class="n">pd</span><span class="o">.</span><span class="n">set_option</span><span class="p">(</span><span class="s1">&#39;display.max_rows&#39;</span><span class="p">,</span> <span class="kc">None</span><span class="p">,</span> <span class="s1">&#39;display.max_columns&#39;</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+</span><span id="outrank_task_result_summary-47"><a href="#outrank_task_result_summary-47"><span class="linenos">47</span></a>    <span class="n">singles_path</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="p">,</span> <span class="s1">&#39;feature_singles.tsv&#39;</span><span class="p">)</span>
+</span><span id="outrank_task_result_summary-48"><a href="#outrank_task_result_summary-48"><span class="linenos">48</span></a>    <span class="n">final_df</span> <span class="o">=</span> <span class="n">final_df</span><span class="o">.</span><span class="n">reset_index</span><span class="p">(</span><span class="n">drop</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="outrank_task_result_summary-49"><a href="#outrank_task_result_summary-49"><span class="linenos">49</span></a>    <span class="n">final_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span><span class="n">singles_path</span><span class="p">,</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="outrank_task_result_summary-50"><a href="#outrank_task_result_summary-50"><span class="linenos">50</span></a>
+</span><span id="outrank_task_result_summary-51"><a href="#outrank_task_result_summary-51"><span class="linenos">51</span></a>    <span class="k">if</span> <span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="outrank_task_result_summary-52"><a href="#outrank_task_result_summary-52"><span class="linenos">52</span></a>        <span class="n">feature_store</span> <span class="o">=</span> <span class="n">defaultdict</span><span class="p">(</span><span class="nb">list</span><span class="p">)</span>
+</span><span id="outrank_task_result_summary-53"><a href="#outrank_task_result_summary-53"><span class="linenos">53</span></a>        <span class="k">for</span> <span class="n">enx</span><span class="p">,</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">final_df</span><span class="o">.</span><span class="n">iterrows</span><span class="p">():</span>
+</span><span id="outrank_task_result_summary-54"><a href="#outrank_task_result_summary-54"><span class="linenos">54</span></a>            <span class="n">fname</span> <span class="o">=</span> <span class="n">row</span><span class="p">[</span><span class="s1">&#39;Feature&#39;</span><span class="p">]</span>
+</span><span id="outrank_task_result_summary-55"><a href="#outrank_task_result_summary-55"><span class="linenos">55</span></a>            <span class="n">score</span> <span class="o">=</span> <span class="n">row</span><span class="p">[</span><span class="sa">f</span><span class="s1">&#39;Score </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">]</span>
+</span><span id="outrank_task_result_summary-56"><a href="#outrank_task_result_summary-56"><span class="linenos">56</span></a>            <span class="k">if</span> <span class="s1">&#39;AND&#39;</span> <span class="ow">in</span> <span class="n">fname</span><span class="p">:</span>
+</span><span id="outrank_task_result_summary-57"><a href="#outrank_task_result_summary-57"><span class="linenos">57</span></a>                <span class="k">for</span> <span class="n">el</span> <span class="ow">in</span> <span class="n">fname</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;-&#39;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39; AND &#39;</span><span class="p">):</span>
+</span><span id="outrank_task_result_summary-58"><a href="#outrank_task_result_summary-58"><span class="linenos">58</span></a>                    <span class="n">feature_store</span><span class="p">[</span><span class="n">el</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">score</span><span class="p">)</span>
+</span><span id="outrank_task_result_summary-59"><a href="#outrank_task_result_summary-59"><span class="linenos">59</span></a>
+</span><span id="outrank_task_result_summary-60"><a href="#outrank_task_result_summary-60"><span class="linenos">60</span></a>        <span class="n">final_aggregate_df</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="outrank_task_result_summary-61"><a href="#outrank_task_result_summary-61"><span class="linenos">61</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">feature_store</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="outrank_task_result_summary-62"><a href="#outrank_task_result_summary-62"><span class="linenos">62</span></a>            <span class="n">final_aggregate_df</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
+</span><span id="outrank_task_result_summary-63"><a href="#outrank_task_result_summary-63"><span class="linenos">63</span></a>                <span class="p">{</span>
+</span><span id="outrank_task_result_summary-64"><a href="#outrank_task_result_summary-64"><span class="linenos">64</span></a>                    <span class="s1">&#39;Feature&#39;</span><span class="p">:</span> <span class="n">k</span><span class="p">,</span>
+</span><span id="outrank_task_result_summary-65"><a href="#outrank_task_result_summary-65"><span class="linenos">65</span></a>                    <span class="sa">f</span><span class="s1">&#39;Combined score (order: </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">interaction_order</span><span class="si">}</span><span class="s1">, </span><span class="si">{</span><span class="n">args</span><span class="o">.</span><span class="n">heuristic</span><span class="si">}</span><span class="s1">)&#39;</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span>
+</span><span id="outrank_task_result_summary-66"><a href="#outrank_task_result_summary-66"><span class="linenos">66</span></a>                        <span class="n">v</span><span class="p">,</span>
+</span><span id="outrank_task_result_summary-67"><a href="#outrank_task_result_summary-67"><span class="linenos">67</span></a>                    <span class="p">),</span>
+</span><span id="outrank_task_result_summary-68"><a href="#outrank_task_result_summary-68"><span class="linenos">68</span></a>                <span class="p">},</span>
+</span><span id="outrank_task_result_summary-69"><a href="#outrank_task_result_summary-69"><span class="linenos">69</span></a>            <span class="p">)</span>
+</span><span id="outrank_task_result_summary-70"><a href="#outrank_task_result_summary-70"><span class="linenos">70</span></a>        <span class="n">final_aggregate_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">final_aggregate_df</span><span class="p">)</span>
+</span><span id="outrank_task_result_summary-71"><a href="#outrank_task_result_summary-71"><span class="linenos">71</span></a>        <span class="n">final_aggregate_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span>
+</span><span id="outrank_task_result_summary-72"><a href="#outrank_task_result_summary-72"><span class="linenos">72</span></a>            <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">args</span><span class="o">.</span><span class="n">output_folder</span><span class="p">,</span> <span class="s1">&#39;feature_singles_aggregated.tsv&#39;</span><span class="p">),</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="outrank_task_result_summary-73"><a href="#outrank_task_result_summary-73"><span class="linenos">73</span></a>        <span class="p">)</span>
+</span><span id="outrank_task_result_summary-74"><a href="#outrank_task_result_summary-74"><span class="linenos">74</span></a>
+</span><span id="outrank_task_result_summary-75"><a href="#outrank_task_result_summary-75"><span class="linenos">75</span></a>    <span class="n">final_df</span> <span class="o">=</span> <span class="n">final_df</span><span class="p">[</span><span class="n">final_df</span><span class="p">[</span><span class="s1">&#39;Feature&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">str</span><span class="o">.</span><span class="n">contains</span><span class="p">(</span><span class="s1">&#39;_tr_&#39;</span><span class="p">)]</span>
+</span><span id="outrank_task_result_summary-76"><a href="#outrank_task_result_summary-76"><span class="linenos">76</span></a>    <span class="n">final_df</span><span class="o">.</span><span class="n">to_csv</span><span class="p">(</span>
+</span><span id="outrank_task_result_summary-77"><a href="#outrank_task_result_summary-77"><span class="linenos">77</span></a>        <span class="n">singles_path</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s1">&#39;.tsv&#39;</span><span class="p">,</span> <span class="s1">&#39;_transformers_only_imp.tsv&#39;</span><span class="p">),</span> <span class="n">sep</span><span class="o">=</span><span class="s1">&#39;</span><span class="se">\t</span><span class="s1">&#39;</span><span class="p">,</span>
+</span><span id="outrank_task_result_summary-78"><a href="#outrank_task_result_summary-78"><span class="linenos">78</span></a>    <span class="p">)</span>
 </span></pre></div>
 
 
-
+    
 
                 </section>
     </main>
@@ -398,4 +400,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/task_visualization.html b/docs/outrank/task_visualization.html
index 157be8c..4b606b4 100644
--- a/docs/outrank/task_visualization.html
+++ b/docs/outrank/task_visualization.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.task_visualization API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -49,7 +49,7 @@ <h2>API Documentation</h2>
                     <h1 class="modulename">
 <a href="./../outrank.html">outrank</a><wbr>.task_visualization    </h1>
 
-
+                
                         <input id="mod-task_visualization-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 
                         <label class="view-source-button" for="mod-task_visualization-view-source"><span>View Source</span></label>
@@ -87,7 +87,7 @@ <h1 class="modulename">
                 <section id="outrank_task_visualize_results">
                             <input id="outrank_task_visualize_results-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">outrank_task_visualize_results</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">args</span></span><span class="return-annotation">):</span></span>
 
@@ -112,7 +112,7 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                 </section>
     </main>
@@ -298,4 +298,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/visualizations.html b/docs/outrank/visualizations.html
index 0d8575a..00e2bb1 100644
--- a/docs/outrank/visualizations.html
+++ b/docs/outrank/visualizations.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.visualizations API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -46,10 +46,10 @@ <h2>Submodules</h2>
                     <h1 class="modulename">
 <a href="./../outrank.html">outrank</a><wbr>.visualizations    </h1>
 
-
-
-
-
+                
+                
+                
+                
             </section>
     </main>
 <script>
@@ -234,4 +234,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/outrank/visualizations/ranking_visualization.html b/docs/outrank/visualizations/ranking_visualization.html
index 8c8d06d..0a06918 100644
--- a/docs/outrank/visualizations/ranking_visualization.html
+++ b/docs/outrank/visualizations/ranking_visualization.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.1.0"/>
+    <meta name="generator" content="pdoc 14.5.1"/>
     <title>outrank.visualizations.ranking_visualization API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -58,7 +58,7 @@ <h2>API Documentation</h2>
                     <h1 class="modulename">
 <a href="./../../outrank.html">outrank</a><wbr>.<a href="./../visualizations.html">visualizations</a><wbr>.ranking_visualization    </h1>
 
-
+                
                         <input id="mod-ranking_visualization-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 
                         <label class="view-source-button" for="mod-ranking_visualization-view-source"><span>View Source</span></label>
@@ -410,7 +410,7 @@ <h1 class="modulename">
                 <section id="visualize_hierarchical_clusters">
                             <input id="visualize_hierarchical_clusters-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">visualize_hierarchical_clusters</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">triplet_dataframe</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>,</span><span class="param">	<span class="n">output_folder</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">image_format</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;png&#39;</span>,</span><span class="param">	<span class="n">max_num_clusters</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">100</span></span><span class="return-annotation">) -> <span class="kc">None</span>:</span></span>
 
@@ -579,7 +579,7 @@ <h1 class="modulename">
                 <section id="visualize_heatmap">
                             <input id="visualize_heatmap-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">visualize_heatmap</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">triplets</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>,</span><span class="param">	<span class="n">output_folder</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">image_format</span><span class="p">:</span> <span class="nb">str</span></span><span class="return-annotation">) -> <span class="kc">None</span>:</span></span>
 
@@ -634,13 +634,13 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                 </section>
                 <section id="visualize_barplots">
                             <input id="visualize_barplots-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">visualize_barplots</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">triplets</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>,</span><span class="param">	<span class="n">output_folder</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">reference_json</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">image_format</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">label</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">heuristic</span><span class="p">:</span> <span class="nb">str</span></span><span class="return-annotation">) -> <span class="kc">None</span>:</span></span>
 
@@ -749,13 +749,13 @@ <h1 class="modulename">
 </span></pre></div>
 
 
-
+    
 
                 </section>
                 <section id="visualize_all">
                             <input id="visualize_all-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
 <div class="attr function">
-
+            
         <span class="def">def</span>
         <span class="name">visualize_all</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">triplets</span><span class="p">:</span> <span class="n">pandas</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">frame</span><span class="o">.</span><span class="n">DataFrame</span>,</span><span class="param">	<span class="n">output_folder</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">label</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;&#39;</span>,</span><span class="param">	<span class="n">reference_json</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;&#39;</span>,</span><span class="param">	<span class="n">image_format</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;png&#39;</span>,</span><span class="param">	<span class="n">heuristic</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;MI&#39;</span></span><span class="return-annotation">) -> <span class="kc">None</span>:</span></span>
 
@@ -977,4 +977,4 @@ <h1 class="modulename">
         }
     });
 </script></body>
-</html>
+</html>
\ No newline at end of file
diff --git a/docs/search.js b/docs/search.js
index 62f1434..871f608 100644
--- a/docs/search.js
+++ b/docs/search.js
@@ -1,6 +1,6 @@
 window.pdocSearch = (function(){
 /** elasticlunr - http://weixsong.github.io * Copyright (C) 2017 Oliver Nightingale * Copyright (C) 2017 Wei Song * MIT Licensed */!function(){function e(e){if(null===e||"object"!=typeof e)return e;var t=e.constructor();for(var n in e)e.hasOwnProperty(n)&&(t[n]=e[n]);return t}var t=function(e){var n=new t.Index;return n.pipeline.add(t.trimmer,t.stopWordFilter,t.stemmer),e&&e.call(n,n),n};t.version="0.9.5",lunr=t,t.utils={},t.utils.warn=function(e){return function(t){e.console&&console.warn&&console.warn(t)}}(this),t.utils.toString=function(e){return void 0===e||null===e?"":e.toString()},t.EventEmitter=function(){this.events={}},t.EventEmitter.prototype.addListener=function(){var e=Array.prototype.slice.call(arguments),t=e.pop(),n=e;if("function"!=typeof t)throw new TypeError("last argument must be a function");n.forEach(function(e){this.hasHandler(e)||(this.events[e]=[]),this.events[e].push(t)},this)},t.EventEmitter.prototype.removeListener=function(e,t){if(this.hasHandler(e)){var n=this.events[e].indexOf(t);-1!==n&&(this.events[e].splice(n,1),0==this.events[e].length&&delete this.events[e])}},t.EventEmitter.prototype.emit=function(e){if(this.hasHandler(e)){var t=Array.prototype.slice.call(arguments,1);this.events[e].forEach(function(e){e.apply(void 0,t)},this)}},t.EventEmitter.prototype.hasHandler=function(e){return e in this.events},t.tokenizer=function(e){if(!arguments.length||null===e||void 0===e)return[];if(Array.isArray(e)){var n=e.filter(function(e){return null===e||void 0===e?!1:!0});n=n.map(function(e){return t.utils.toString(e).toLowerCase()});var i=[];return n.forEach(function(e){var n=e.split(t.tokenizer.seperator);i=i.concat(n)},this),i}return e.toString().trim().toLowerCase().split(t.tokenizer.seperator)},t.tokenizer.defaultSeperator=/[\s\-]+/,t.tokenizer.seperator=t.tokenizer.defaultSeperator,t.tokenizer.setSeperator=function(e){null!==e&&void 0!==e&&"object"==typeof e&&(t.tokenizer.seperator=e)},t.tokenizer.resetSeperator=function(){t.tokenizer.seperator=t.tokenizer.defaultSeperator},t.tokenizer.getSeperator=function(){return t.tokenizer.seperator},t.Pipeline=function(){this._queue=[]},t.Pipeline.registeredFunctions={},t.Pipeline.registerFunction=function(e,n){n in t.Pipeline.registeredFunctions&&t.utils.warn("Overwriting existing registered function: "+n),e.label=n,t.Pipeline.registeredFunctions[n]=e},t.Pipeline.getRegisteredFunction=function(e){return e in t.Pipeline.registeredFunctions!=!0?null:t.Pipeline.registeredFunctions[e]},t.Pipeline.warnIfFunctionNotRegistered=function(e){var n=e.label&&e.label in this.registeredFunctions;n||t.utils.warn("Function is not registered with pipeline. This may cause problems when serialising the index.\n",e)},t.Pipeline.load=function(e){var n=new t.Pipeline;return e.forEach(function(e){var i=t.Pipeline.getRegisteredFunction(e);if(!i)throw new Error("Cannot load un-registered function: "+e);n.add(i)}),n},t.Pipeline.prototype.add=function(){var e=Array.prototype.slice.call(arguments);e.forEach(function(e){t.Pipeline.warnIfFunctionNotRegistered(e),this._queue.push(e)},this)},t.Pipeline.prototype.after=function(e,n){t.Pipeline.warnIfFunctionNotRegistered(n);var i=this._queue.indexOf(e);if(-1===i)throw new Error("Cannot find existingFn");this._queue.splice(i+1,0,n)},t.Pipeline.prototype.before=function(e,n){t.Pipeline.warnIfFunctionNotRegistered(n);var i=this._queue.indexOf(e);if(-1===i)throw new Error("Cannot find existingFn");this._queue.splice(i,0,n)},t.Pipeline.prototype.remove=function(e){var t=this._queue.indexOf(e);-1!==t&&this._queue.splice(t,1)},t.Pipeline.prototype.run=function(e){for(var t=[],n=e.length,i=this._queue.length,o=0;n>o;o++){for(var r=e[o],s=0;i>s&&(r=this._queue[s](r,o,e),void 0!==r&&null!==r);s++);void 0!==r&&null!==r&&t.push(r)}return t},t.Pipeline.prototype.reset=function(){this._queue=[]},t.Pipeline.prototype.get=function(){return this._queue},t.Pipeline.prototype.toJSON=function(){return this._queue.map(function(e){return t.Pipeline.warnIfFunctionNotRegistered(e),e.label})},t.Index=function(){this._fields=[],this._ref="id",this.pipeline=new t.Pipeline,this.documentStore=new t.DocumentStore,this.index={},this.eventEmitter=new t.EventEmitter,this._idfCache={},this.on("add","remove","update",function(){this._idfCache={}}.bind(this))},t.Index.prototype.on=function(){var e=Array.prototype.slice.call(arguments);return this.eventEmitter.addListener.apply(this.eventEmitter,e)},t.Index.prototype.off=function(e,t){return this.eventEmitter.removeListener(e,t)},t.Index.load=function(e){e.version!==t.version&&t.utils.warn("version mismatch: current "+t.version+" importing "+e.version);var n=new this;n._fields=e.fields,n._ref=e.ref,n.documentStore=t.DocumentStore.load(e.documentStore),n.pipeline=t.Pipeline.load(e.pipeline),n.index={};for(var i in e.index)n.index[i]=t.InvertedIndex.load(e.index[i]);return n},t.Index.prototype.addField=function(e){return this._fields.push(e),this.index[e]=new t.InvertedIndex,this},t.Index.prototype.setRef=function(e){return this._ref=e,this},t.Index.prototype.saveDocument=function(e){return this.documentStore=new t.DocumentStore(e),this},t.Index.prototype.addDoc=function(e,n){if(e){var n=void 0===n?!0:n,i=e[this._ref];this.documentStore.addDoc(i,e),this._fields.forEach(function(n){var o=this.pipeline.run(t.tokenizer(e[n]));this.documentStore.addFieldLength(i,n,o.length);var r={};o.forEach(function(e){e in r?r[e]+=1:r[e]=1},this);for(var s in r){var u=r[s];u=Math.sqrt(u),this.index[n].addToken(s,{ref:i,tf:u})}},this),n&&this.eventEmitter.emit("add",e,this)}},t.Index.prototype.removeDocByRef=function(e){if(e&&this.documentStore.isDocStored()!==!1&&this.documentStore.hasDoc(e)){var t=this.documentStore.getDoc(e);this.removeDoc(t,!1)}},t.Index.prototype.removeDoc=function(e,n){if(e){var n=void 0===n?!0:n,i=e[this._ref];this.documentStore.hasDoc(i)&&(this.documentStore.removeDoc(i),this._fields.forEach(function(n){var o=this.pipeline.run(t.tokenizer(e[n]));o.forEach(function(e){this.index[n].removeToken(e,i)},this)},this),n&&this.eventEmitter.emit("remove",e,this))}},t.Index.prototype.updateDoc=function(e,t){var t=void 0===t?!0:t;this.removeDocByRef(e[this._ref],!1),this.addDoc(e,!1),t&&this.eventEmitter.emit("update",e,this)},t.Index.prototype.idf=function(e,t){var n="@"+t+"/"+e;if(Object.prototype.hasOwnProperty.call(this._idfCache,n))return this._idfCache[n];var i=this.index[t].getDocFreq(e),o=1+Math.log(this.documentStore.length/(i+1));return this._idfCache[n]=o,o},t.Index.prototype.getFields=function(){return this._fields.slice()},t.Index.prototype.search=function(e,n){if(!e)return[];e="string"==typeof e?{any:e}:JSON.parse(JSON.stringify(e));var i=null;null!=n&&(i=JSON.stringify(n));for(var o=new t.Configuration(i,this.getFields()).get(),r={},s=Object.keys(e),u=0;u<s.length;u++){var a=s[u];r[a]=this.pipeline.run(t.tokenizer(e[a]))}var l={};for(var c in o){var d=r[c]||r.any;if(d){var f=this.fieldSearch(d,c,o),h=o[c].boost;for(var p in f)f[p]=f[p]*h;for(var p in f)p in l?l[p]+=f[p]:l[p]=f[p]}}var v,g=[];for(var p in l)v={ref:p,score:l[p]},this.documentStore.hasDoc(p)&&(v.doc=this.documentStore.getDoc(p)),g.push(v);return g.sort(function(e,t){return t.score-e.score}),g},t.Index.prototype.fieldSearch=function(e,t,n){var i=n[t].bool,o=n[t].expand,r=n[t].boost,s=null,u={};return 0!==r?(e.forEach(function(e){var n=[e];1==o&&(n=this.index[t].expandToken(e));var r={};n.forEach(function(n){var o=this.index[t].getDocs(n),a=this.idf(n,t);if(s&&"AND"==i){var l={};for(var c in s)c in o&&(l[c]=o[c]);o=l}n==e&&this.fieldSearchStats(u,n,o);for(var c in o){var d=this.index[t].getTermFrequency(n,c),f=this.documentStore.getFieldLength(c,t),h=1;0!=f&&(h=1/Math.sqrt(f));var p=1;n!=e&&(p=.15*(1-(n.length-e.length)/n.length));var v=d*a*h*p;c in r?r[c]+=v:r[c]=v}},this),s=this.mergeScores(s,r,i)},this),s=this.coordNorm(s,u,e.length)):void 0},t.Index.prototype.mergeScores=function(e,t,n){if(!e)return t;if("AND"==n){var i={};for(var o in t)o in e&&(i[o]=e[o]+t[o]);return i}for(var o in t)o in e?e[o]+=t[o]:e[o]=t[o];return e},t.Index.prototype.fieldSearchStats=function(e,t,n){for(var i in n)i in e?e[i].push(t):e[i]=[t]},t.Index.prototype.coordNorm=function(e,t,n){for(var i in e)if(i in t){var o=t[i].length;e[i]=e[i]*o/n}return e},t.Index.prototype.toJSON=function(){var e={};return this._fields.forEach(function(t){e[t]=this.index[t].toJSON()},this),{version:t.version,fields:this._fields,ref:this._ref,documentStore:this.documentStore.toJSON(),index:e,pipeline:this.pipeline.toJSON()}},t.Index.prototype.use=function(e){var t=Array.prototype.slice.call(arguments,1);t.unshift(this),e.apply(this,t)},t.DocumentStore=function(e){this._save=null===e||void 0===e?!0:e,this.docs={},this.docInfo={},this.length=0},t.DocumentStore.load=function(e){var t=new this;return t.length=e.length,t.docs=e.docs,t.docInfo=e.docInfo,t._save=e.save,t},t.DocumentStore.prototype.isDocStored=function(){return this._save},t.DocumentStore.prototype.addDoc=function(t,n){this.hasDoc(t)||this.length++,this.docs[t]=this._save===!0?e(n):null},t.DocumentStore.prototype.getDoc=function(e){return this.hasDoc(e)===!1?null:this.docs[e]},t.DocumentStore.prototype.hasDoc=function(e){return e in this.docs},t.DocumentStore.prototype.removeDoc=function(e){this.hasDoc(e)&&(delete this.docs[e],delete this.docInfo[e],this.length--)},t.DocumentStore.prototype.addFieldLength=function(e,t,n){null!==e&&void 0!==e&&0!=this.hasDoc(e)&&(this.docInfo[e]||(this.docInfo[e]={}),this.docInfo[e][t]=n)},t.DocumentStore.prototype.updateFieldLength=function(e,t,n){null!==e&&void 0!==e&&0!=this.hasDoc(e)&&this.addFieldLength(e,t,n)},t.DocumentStore.prototype.getFieldLength=function(e,t){return null===e||void 0===e?0:e in this.docs&&t in this.docInfo[e]?this.docInfo[e][t]:0},t.DocumentStore.prototype.toJSON=function(){return{docs:this.docs,docInfo:this.docInfo,length:this.length,save:this._save}},t.stemmer=function(){var e={ational:"ate",tional:"tion",enci:"ence",anci:"ance",izer:"ize",bli:"ble",alli:"al",entli:"ent",eli:"e",ousli:"ous",ization:"ize",ation:"ate",ator:"ate",alism:"al",iveness:"ive",fulness:"ful",ousness:"ous",aliti:"al",iviti:"ive",biliti:"ble",logi:"log"},t={icate:"ic",ative:"",alize:"al",iciti:"ic",ical:"ic",ful:"",ness:""},n="[^aeiou]",i="[aeiouy]",o=n+"[^aeiouy]*",r=i+"[aeiou]*",s="^("+o+")?"+r+o,u="^("+o+")?"+r+o+"("+r+")?$",a="^("+o+")?"+r+o+r+o,l="^("+o+")?"+i,c=new RegExp(s),d=new RegExp(a),f=new RegExp(u),h=new RegExp(l),p=/^(.+?)(ss|i)es$/,v=/^(.+?)([^s])s$/,g=/^(.+?)eed$/,m=/^(.+?)(ed|ing)$/,y=/.$/,S=/(at|bl|iz)$/,x=new RegExp("([^aeiouylsz])\\1$"),w=new RegExp("^"+o+i+"[^aeiouwxy]$"),I=/^(.+?[^aeiou])y$/,b=/^(.+?)(ational|tional|enci|anci|izer|bli|alli|entli|eli|ousli|ization|ation|ator|alism|iveness|fulness|ousness|aliti|iviti|biliti|logi)$/,E=/^(.+?)(icate|ative|alize|iciti|ical|ful|ness)$/,D=/^(.+?)(al|ance|ence|er|ic|able|ible|ant|ement|ment|ent|ou|ism|ate|iti|ous|ive|ize)$/,F=/^(.+?)(s|t)(ion)$/,_=/^(.+?)e$/,P=/ll$/,k=new RegExp("^"+o+i+"[^aeiouwxy]$"),z=function(n){var i,o,r,s,u,a,l;if(n.length<3)return n;if(r=n.substr(0,1),"y"==r&&(n=r.toUpperCase()+n.substr(1)),s=p,u=v,s.test(n)?n=n.replace(s,"$1$2"):u.test(n)&&(n=n.replace(u,"$1$2")),s=g,u=m,s.test(n)){var z=s.exec(n);s=c,s.test(z[1])&&(s=y,n=n.replace(s,""))}else if(u.test(n)){var z=u.exec(n);i=z[1],u=h,u.test(i)&&(n=i,u=S,a=x,l=w,u.test(n)?n+="e":a.test(n)?(s=y,n=n.replace(s,"")):l.test(n)&&(n+="e"))}if(s=I,s.test(n)){var z=s.exec(n);i=z[1],n=i+"i"}if(s=b,s.test(n)){var z=s.exec(n);i=z[1],o=z[2],s=c,s.test(i)&&(n=i+e[o])}if(s=E,s.test(n)){var z=s.exec(n);i=z[1],o=z[2],s=c,s.test(i)&&(n=i+t[o])}if(s=D,u=F,s.test(n)){var z=s.exec(n);i=z[1],s=d,s.test(i)&&(n=i)}else if(u.test(n)){var z=u.exec(n);i=z[1]+z[2],u=d,u.test(i)&&(n=i)}if(s=_,s.test(n)){var z=s.exec(n);i=z[1],s=d,u=f,a=k,(s.test(i)||u.test(i)&&!a.test(i))&&(n=i)}return s=P,u=d,s.test(n)&&u.test(n)&&(s=y,n=n.replace(s,"")),"y"==r&&(n=r.toLowerCase()+n.substr(1)),n};return z}(),t.Pipeline.registerFunction(t.stemmer,"stemmer"),t.stopWordFilter=function(e){return e&&t.stopWordFilter.stopWords[e]!==!0?e:void 0},t.clearStopWords=function(){t.stopWordFilter.stopWords={}},t.addStopWords=function(e){null!=e&&Array.isArray(e)!==!1&&e.forEach(function(e){t.stopWordFilter.stopWords[e]=!0},this)},t.resetStopWords=function(){t.stopWordFilter.stopWords=t.defaultStopWords},t.defaultStopWords={"":!0,a:!0,able:!0,about:!0,across:!0,after:!0,all:!0,almost:!0,also:!0,am:!0,among:!0,an:!0,and:!0,any:!0,are:!0,as:!0,at:!0,be:!0,because:!0,been:!0,but:!0,by:!0,can:!0,cannot:!0,could:!0,dear:!0,did:!0,"do":!0,does:!0,either:!0,"else":!0,ever:!0,every:!0,"for":!0,from:!0,get:!0,got:!0,had:!0,has:!0,have:!0,he:!0,her:!0,hers:!0,him:!0,his:!0,how:!0,however:!0,i:!0,"if":!0,"in":!0,into:!0,is:!0,it:!0,its:!0,just:!0,least:!0,let:!0,like:!0,likely:!0,may:!0,me:!0,might:!0,most:!0,must:!0,my:!0,neither:!0,no:!0,nor:!0,not:!0,of:!0,off:!0,often:!0,on:!0,only:!0,or:!0,other:!0,our:!0,own:!0,rather:!0,said:!0,say:!0,says:!0,she:!0,should:!0,since:!0,so:!0,some:!0,than:!0,that:!0,the:!0,their:!0,them:!0,then:!0,there:!0,these:!0,they:!0,"this":!0,tis:!0,to:!0,too:!0,twas:!0,us:!0,wants:!0,was:!0,we:!0,were:!0,what:!0,when:!0,where:!0,which:!0,"while":!0,who:!0,whom:!0,why:!0,will:!0,"with":!0,would:!0,yet:!0,you:!0,your:!0},t.stopWordFilter.stopWords=t.defaultStopWords,t.Pipeline.registerFunction(t.stopWordFilter,"stopWordFilter"),t.trimmer=function(e){if(null===e||void 0===e)throw new Error("token should not be undefined");return e.replace(/^\W+/,"").replace(/\W+$/,"")},t.Pipeline.registerFunction(t.trimmer,"trimmer"),t.InvertedIndex=function(){this.root={docs:{},df:0}},t.InvertedIndex.load=function(e){var t=new this;return t.root=e.root,t},t.InvertedIndex.prototype.addToken=function(e,t,n){for(var n=n||this.root,i=0;i<=e.length-1;){var o=e[i];o in n||(n[o]={docs:{},df:0}),i+=1,n=n[o]}var r=t.ref;n.docs[r]?n.docs[r]={tf:t.tf}:(n.docs[r]={tf:t.tf},n.df+=1)},t.InvertedIndex.prototype.hasToken=function(e){if(!e)return!1;for(var t=this.root,n=0;n<e.length;n++){if(!t[e[n]])return!1;t=t[e[n]]}return!0},t.InvertedIndex.prototype.getNode=function(e){if(!e)return null;for(var t=this.root,n=0;n<e.length;n++){if(!t[e[n]])return null;t=t[e[n]]}return t},t.InvertedIndex.prototype.getDocs=function(e){var t=this.getNode(e);return null==t?{}:t.docs},t.InvertedIndex.prototype.getTermFrequency=function(e,t){var n=this.getNode(e);return null==n?0:t in n.docs?n.docs[t].tf:0},t.InvertedIndex.prototype.getDocFreq=function(e){var t=this.getNode(e);return null==t?0:t.df},t.InvertedIndex.prototype.removeToken=function(e,t){if(e){var n=this.getNode(e);null!=n&&t in n.docs&&(delete n.docs[t],n.df-=1)}},t.InvertedIndex.prototype.expandToken=function(e,t,n){if(null==e||""==e)return[];var t=t||[];if(void 0==n&&(n=this.getNode(e),null==n))return t;n.df>0&&t.push(e);for(var i in n)"docs"!==i&&"df"!==i&&this.expandToken(e+i,t,n[i]);return t},t.InvertedIndex.prototype.toJSON=function(){return{root:this.root}},t.Configuration=function(e,n){var e=e||"";if(void 0==n||null==n)throw new Error("fields should not be null");this.config={};var i;try{i=JSON.parse(e),this.buildUserConfig(i,n)}catch(o){t.utils.warn("user configuration parse failed, will use default configuration"),this.buildDefaultConfig(n)}},t.Configuration.prototype.buildDefaultConfig=function(e){this.reset(),e.forEach(function(e){this.config[e]={boost:1,bool:"OR",expand:!1}},this)},t.Configuration.prototype.buildUserConfig=function(e,n){var i="OR",o=!1;if(this.reset(),"bool"in e&&(i=e.bool||i),"expand"in e&&(o=e.expand||o),"fields"in e)for(var r in e.fields)if(n.indexOf(r)>-1){var s=e.fields[r],u=o;void 0!=s.expand&&(u=s.expand),this.config[r]={boost:s.boost||0===s.boost?s.boost:1,bool:s.bool||i,expand:u}}else t.utils.warn("field name in user configuration not found in index instance fields");else this.addAllFields2UserConfig(i,o,n)},t.Configuration.prototype.addAllFields2UserConfig=function(e,t,n){n.forEach(function(n){this.config[n]={boost:1,bool:e,expand:t}},this)},t.Configuration.prototype.get=function(){return this.config},t.Configuration.prototype.reset=function(){this.config={}},lunr.SortedSet=function(){this.length=0,this.elements=[]},lunr.SortedSet.load=function(e){var t=new this;return t.elements=e,t.length=e.length,t},lunr.SortedSet.prototype.add=function(){var e,t;for(e=0;e<arguments.length;e++)t=arguments[e],~this.indexOf(t)||this.elements.splice(this.locationFor(t),0,t);this.length=this.elements.length},lunr.SortedSet.prototype.toArray=function(){return this.elements.slice()},lunr.SortedSet.prototype.map=function(e,t){return this.elements.map(e,t)},lunr.SortedSet.prototype.forEach=function(e,t){return this.elements.forEach(e,t)},lunr.SortedSet.prototype.indexOf=function(e){for(var t=0,n=this.elements.length,i=n-t,o=t+Math.floor(i/2),r=this.elements[o];i>1;){if(r===e)return o;e>r&&(t=o),r>e&&(n=o),i=n-t,o=t+Math.floor(i/2),r=this.elements[o]}return r===e?o:-1},lunr.SortedSet.prototype.locationFor=function(e){for(var t=0,n=this.elements.length,i=n-t,o=t+Math.floor(i/2),r=this.elements[o];i>1;)e>r&&(t=o),r>e&&(n=o),i=n-t,o=t+Math.floor(i/2),r=this.elements[o];return r>e?o:e>r?o+1:void 0},lunr.SortedSet.prototype.intersect=function(e){for(var t=new lunr.SortedSet,n=0,i=0,o=this.length,r=e.length,s=this.elements,u=e.elements;;){if(n>o-1||i>r-1)break;s[n]!==u[i]?s[n]<u[i]?n++:s[n]>u[i]&&i++:(t.add(s[n]),n++,i++)}return t},lunr.SortedSet.prototype.clone=function(){var e=new lunr.SortedSet;return e.elements=this.toArray(),e.length=e.elements.length,e},lunr.SortedSet.prototype.union=function(e){var t,n,i;this.length>=e.length?(t=this,n=e):(t=e,n=this),i=t.clone();for(var o=0,r=n.toArray();o<r.length;o++)i.add(r[o]);return i},lunr.SortedSet.prototype.toJSON=function(){return this.toArray()},function(e,t){"function"==typeof define&&define.amd?define(t):"object"==typeof exports?module.exports=t():e.elasticlunr=t()}(this,function(){return t})}();
-    /** pdoc search index */const docs = {"version": "0.9.5", "fields": ["qualname", "fullname", "annotation", "default_value", "signature", "bases", "doc"], "ref": "fullname", "documentStore": {"docs": {"outrank": {"fullname": "outrank", "modulename": "outrank", "kind": "module", "doc": "<h1 id=\"welcome-to-outranks-documentation\">Welcome to OutRank's documentation!</h1>\n\n<p>All functions/methods can be searched-for (search bar on the left).</p>\n\n<p>This tool enables fast screening of feature-feature interactions. Its purpose is to give the user fast insight into potential redundancies/anomalies in the data.\nIt is implemented to operate in _mini batches_, it traverses the <code>raw data</code> incrementally, refining the rankings as it goes along. The core operation, interaction ranking, outputs triplets which look as follows:</p>\n\n<pre><code>featureA    featureB    0.512\nfeatureA    featureC    0.125\n</code></pre>\n\n<h1 id=\"setup\">Setup</h1>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code>pip<span class=\"w\"> </span>install<span class=\"w\"> </span>outrank\n</code></pre>\n</div>\n\n<p>and test a minimal cycle with</p>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code>outrank<span class=\"w\"> </span>--task<span class=\"w\"> </span>selftest\n</code></pre>\n</div>\n\n<p>if this passes, you can be pretty certain OutRank will perform as intended. OutRank's primary use case is as a CLI tool, begin exploring with</p>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code>outrank<span class=\"w\"> </span>--help\n</code></pre>\n</div>\n\n<h1 id=\"example-use-cases\">Example use cases</h1>\n\n<ul>\n<li><p>A minimal showcase of performing feature ranking on a generic CSV is demonstrated with <a href=\"https://github.com/outbrain/outrank/tree/main/scripts/run_minimal.sh\">this example</a>.</p></li>\n<li><p><a href=\"https://github.com/outbrain/outrank/tree/main/examples\">More examples</a> demonstrating OutRank's capabilities are also available.</p></li>\n</ul>\n\n<h1 id=\"outrank-as-a-python-library\">OutRank as a Python library</h1>\n\n<p>Once installed, _OutRank_ can be used as any other Python library. For example, generic feature ranking algorithms can be accessed as</p>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"kn\">from</span> <span class=\"nn\">outrank.algorithms.feature_ranking.ranking_mi_numba</span> <span class=\"kn\">import</span> <span class=\"p\">(</span>\n    <span class=\"n\">mutual_info_estimator_numba</span><span class=\"p\">,</span>\n<span class=\"p\">)</span>\n\n<span class=\"c1\"># Some synthetic minimal data (Numpy vectors)</span>\n<span class=\"n\">a</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">([</span><span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">],</span> <span class=\"n\">dtype</span><span class=\"o\">=</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">int32</span><span class=\"p\">)</span>\n\n<span class=\"n\">lowest</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">(</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">random</span><span class=\"o\">.</span><span class=\"n\">permutation</span><span class=\"p\">(</span><span class=\"n\">a</span><span class=\"p\">),</span> <span class=\"n\">dtype</span><span class=\"o\">=</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">int32</span><span class=\"p\">)</span>\n<span class=\"n\">medium</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">([</span><span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">],</span> <span class=\"n\">dtype</span><span class=\"o\">=</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">int32</span><span class=\"p\">)</span>\n<span class=\"n\">high</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">([</span><span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">],</span> <span class=\"n\">dtype</span><span class=\"o\">=</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">int32</span><span class=\"p\">)</span>\n\n<span class=\"n\">lowest_score</span> <span class=\"o\">=</span> <span class=\"n\">mutual_info_estimator_numba</span><span class=\"p\">(</span>\n    <span class=\"n\">a</span><span class=\"p\">,</span> <span class=\"n\">lowest</span><span class=\"p\">,</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">float32</span><span class=\"p\">(</span><span class=\"mf\">1.0</span><span class=\"p\">),</span> <span class=\"kc\">False</span><span class=\"p\">,</span>\n<span class=\"p\">)</span>\n<span class=\"n\">medium_score</span> <span class=\"o\">=</span> <span class=\"n\">mutual_info_estimator_numba</span><span class=\"p\">(</span>\n    <span class=\"n\">a</span><span class=\"p\">,</span> <span class=\"n\">medium</span><span class=\"p\">,</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">float32</span><span class=\"p\">(</span><span class=\"mf\">1.0</span><span class=\"p\">),</span> <span class=\"kc\">False</span><span class=\"p\">,</span>\n<span class=\"p\">)</span>\n<span class=\"n\">high_score</span> <span class=\"o\">=</span> <span class=\"n\">mutual_info_estimator_numba</span><span class=\"p\">(</span>\n    <span class=\"n\">a</span><span class=\"p\">,</span> <span class=\"n\">high</span><span class=\"p\">,</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">float32</span><span class=\"p\">(</span><span class=\"mf\">1.0</span><span class=\"p\">),</span> <span class=\"kc\">False</span><span class=\"p\">,</span>\n<span class=\"p\">)</span>\n\n<span class=\"n\">scores</span> <span class=\"o\">=</span> <span class=\"p\">[</span><span class=\"n\">lowest_score</span><span class=\"p\">,</span> <span class=\"n\">medium_score</span><span class=\"p\">,</span> <span class=\"n\">high_score</span><span class=\"p\">]</span>\n<span class=\"n\">sorted_score_indices</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">argsort</span><span class=\"p\">(</span><span class=\"n\">scores</span><span class=\"p\">)</span>\n<span class=\"k\">assert</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">sum</span><span class=\"p\">(</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">([</span><span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">2</span><span class=\"p\">])</span> <span class=\"o\">-</span> <span class=\"n\">sorted_score_indices</span><span class=\"p\">)</span> <span class=\"o\">==</span>  <span class=\"mi\">0</span>\n</code></pre>\n</div>\n"}, "outrank.algorithms": {"fullname": "outrank.algorithms", "modulename": "outrank.algorithms", "kind": "module", "doc": "<p></p>\n"}, "outrank.algorithms.feature_ranking": {"fullname": "outrank.algorithms.feature_ranking", "modulename": "outrank.algorithms.feature_ranking", "kind": "module", "doc": "<p></p>\n"}, "outrank.algorithms.feature_ranking.ranking_mi_numba": {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "kind": "module", "doc": "<p></p>\n"}, "outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "numba_unique", "kind": "function", "doc": "<p>Identify unique elements in an array, fast</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">a</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "compute_conditional_entropy", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">Y_classes</span>,</span><span class=\"param\">\t<span class=\"n\">class_values</span>,</span><span class=\"param\">\t<span class=\"n\">class_var_shape</span>,</span><span class=\"param\">\t<span class=\"n\">initial_prob</span>,</span><span class=\"param\">\t<span class=\"n\">nonzero_counts</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "compute_entropies", "kind": "function", "doc": "<p>Core entropy computation function</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">X</span>, </span><span class=\"param\"><span class=\"n\">Y</span>, </span><span class=\"param\"><span class=\"n\">all_events</span>, </span><span class=\"param\"><span class=\"n\">f_values</span>, </span><span class=\"param\"><span class=\"n\">f_value_counts</span>, </span><span class=\"param\"><span class=\"n\">cardinality_correction</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "stratified_subsampling", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">Y</span>, </span><span class=\"param\"><span class=\"n\">X</span>, </span><span class=\"param\"><span class=\"n\">approximation_factor</span>, </span><span class=\"param\"><span class=\"n\">_f_values_X</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "mutual_info_estimator_numba", "kind": "function", "doc": "<p>Core estimator logic. Compute unique elements, subset if required</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">Y</span>, </span><span class=\"param\"><span class=\"n\">X</span>, </span><span class=\"param\"><span class=\"n\">approximation_factor</span><span class=\"o\">=</span><span class=\"mf\">1.0</span>, </span><span class=\"param\"><span class=\"n\">cardinality_correction</span><span class=\"o\">=</span><span class=\"kc\">False</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.algorithms.importance_estimator": {"fullname": "outrank.algorithms.importance_estimator", "modulename": "outrank.algorithms.importance_estimator", "kind": "module", "doc": "<p></p>\n"}, "outrank.algorithms.importance_estimator.logger": {"fullname": "outrank.algorithms.importance_estimator.logger", "modulename": "outrank.algorithms.importance_estimator", "qualname": "logger", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;Logger syn-logger (DEBUG)&gt;"}, "outrank.algorithms.importance_estimator.sklearn_MI": {"fullname": "outrank.algorithms.importance_estimator.sklearn_MI", "modulename": "outrank.algorithms.importance_estimator", "qualname": "sklearn_MI", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">vector_first</span><span class=\"p\">:</span> <span class=\"n\">Any</span>, </span><span class=\"param\"><span class=\"n\">vector_second</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">float</span>:</span></span>", "funcdef": "def"}, "outrank.algorithms.importance_estimator.sklearn_surrogate": {"fullname": "outrank.algorithms.importance_estimator.sklearn_surrogate", "modulename": "outrank.algorithms.importance_estimator", "qualname": "sklearn_surrogate", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">vector_first</span><span class=\"p\">:</span> <span class=\"n\">Any</span>, </span><span class=\"param\"><span class=\"n\">vector_second</span><span class=\"p\">:</span> <span class=\"n\">Any</span>, </span><span class=\"param\"><span class=\"n\">surrogate_model</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">float</span>:</span></span>", "funcdef": "def"}, "outrank.algorithms.importance_estimator.numba_mi": {"fullname": "outrank.algorithms.importance_estimator.numba_mi", "modulename": "outrank.algorithms.importance_estimator", "qualname": "numba_mi", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">vector_first</span>, </span><span class=\"param\"><span class=\"n\">vector_second</span>, </span><span class=\"param\"><span class=\"n\">heuristic</span>, </span><span class=\"param\"><span class=\"n\">mi_stratified_sampling_ratio</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.algorithms.importance_estimator.sklearn_mi_adj": {"fullname": "outrank.algorithms.importance_estimator.sklearn_mi_adj", "modulename": "outrank.algorithms.importance_estimator", "qualname": "sklearn_mi_adj", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">vector_first</span>, </span><span class=\"param\"><span class=\"n\">vector_second</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"fullname": "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise", "modulename": "outrank.algorithms.importance_estimator", "qualname": "get_importances_estimate_pairwise", "kind": "function", "doc": "<p>A method for parallel importances estimation. As interaction scoring is independent, individual scores can be computed in parallel.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">combination</span>, </span><span class=\"param\"><span class=\"n\">args</span>, </span><span class=\"param\"><span class=\"n\">tmp_df</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.algorithms.importance_estimator.rank_features_3MR": {"fullname": "outrank.algorithms.importance_estimator.rank_features_3MR", "modulename": "outrank.algorithms.importance_estimator", "qualname": "rank_features_3MR", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">relevance_dict</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">redundancy_dict</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">relational_dict</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">strategy</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;median&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">alpha</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mi\">1</span>,</span><span class=\"param\">\t<span class=\"n\">beta</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mi\">1</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"fullname": "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic", "modulename": "outrank.algorithms.importance_estimator", "qualname": "get_importances_estimate_nonmyopic", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>, </span><span class=\"param\"><span class=\"n\">tmp_df</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.algorithms.sketches": {"fullname": "outrank.algorithms.sketches", "modulename": "outrank.algorithms.sketches", "kind": "module", "doc": "<p></p>\n"}, "outrank.algorithms.sketches.counting_cms": {"fullname": "outrank.algorithms.sketches.counting_cms", "modulename": "outrank.algorithms.sketches.counting_cms", "kind": "module", "doc": "<p></p>\n"}, "outrank.algorithms.sketches.counting_cms.cms_hash": {"fullname": "outrank.algorithms.sketches.counting_cms.cms_hash", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "cms_hash", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">x</span>, </span><span class=\"param\"><span class=\"n\">seed</span>, </span><span class=\"param\"><span class=\"n\">width</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.algorithms.sketches.counting_cms.CountMinSketch": {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch", "kind": "class", "doc": "<p>A memory-efficient implementation of the count min sketch algorithm with optimized hashing using Numba JIT.</p>\n"}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">depth</span><span class=\"o\">=</span><span class=\"mi\">6</span>, </span><span class=\"param\"><span class=\"n\">width</span><span class=\"o\">=</span><span class=\"mi\">32768</span>, </span><span class=\"param\"><span class=\"n\">M</span><span class=\"o\">=</span><span class=\"kc\">None</span></span>)</span>"}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.depth": {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.depth", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.depth", "kind": "variable", "doc": "<p></p>\n"}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.width": {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.width", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.width", "kind": "variable", "doc": "<p></p>\n"}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds": {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.hash_seeds", "kind": "variable", "doc": "<p></p>\n"}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.M": {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.M", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.M", "kind": "variable", "doc": "<p></p>\n"}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.add": {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.add", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">x</span>, </span><span class=\"param\"><span class=\"n\">delta</span><span class=\"o\">=</span><span class=\"mi\">1</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.batch_add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">lst</span>, </span><span class=\"param\"><span class=\"n\">delta</span><span class=\"o\">=</span><span class=\"mi\">1</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.query": {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.query", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.query", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">x</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix": {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.get_matrix", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.algorithms.sketches.counting_counters_ordinary": {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "kind": "module", "doc": "<p></p>\n"}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter", "kind": "class", "doc": "<p>A memory-efficient implementation of the count min sketch algorithm with optimized hashing using Numba JIT.</p>\n"}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">bound</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">30000</span></span>)</span>"}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr": {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.max_bound_thr", "kind": "variable", "doc": "<p></p>\n"}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.default_counter", "kind": "variable", "doc": "<p></p>\n", "annotation": ": collections.Counter"}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.batch_add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">lst</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add": {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">val</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.algorithms.sketches.counting_ultiloglog": {"fullname": "outrank.algorithms.sketches.counting_ultiloglog", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "kind": "module", "doc": "<p>This module implements probabilistic data structure which is able to calculate the cardinality of large multisets in a single pass using little auxiliary memory</p>\n"}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache": {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache", "kind": "class", "doc": "<p></p>\n"}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">error_rate</span><span class=\"o\">=</span><span class=\"mf\">0.005</span></span>)</span>"}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.p": {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.p", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.p", "kind": "variable", "doc": "<p></p>\n"}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.m": {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.m", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.m", "kind": "variable", "doc": "<p></p>\n"}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set": {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.warmup_set", "kind": "variable", "doc": "<p></p>\n"}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size": {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.warmup_size", "kind": "variable", "doc": "<p></p>\n"}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.width": {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.width", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.width", "kind": "variable", "doc": "<p></p>\n"}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag": {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.hll_flag", "kind": "variable", "doc": "<p></p>\n"}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add": {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">value</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.algorithms.synthetic_data_generators": {"fullname": "outrank.algorithms.synthetic_data_generators", "modulename": "outrank.algorithms.synthetic_data_generators", "kind": "module", "doc": "<p></p>\n"}, "outrank.algorithms.synthetic_data_generators.generator_naive": {"fullname": "outrank.algorithms.synthetic_data_generators.generator_naive", "modulename": "outrank.algorithms.synthetic_data_generators.generator_naive", "kind": "module", "doc": "<p></p>\n"}, "outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"fullname": "outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix", "modulename": "outrank.algorithms.synthetic_data_generators.generator_naive", "qualname": "generate_random_matrix", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">num_features</span><span class=\"o\">=</span><span class=\"mi\">100</span>, </span><span class=\"param\"><span class=\"n\">size</span><span class=\"o\">=</span><span class=\"mi\">20000</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.core_ranking": {"fullname": "outrank.core_ranking", "modulename": "outrank.core_ranking", "kind": "module", "doc": "<p></p>\n"}, "outrank.core_ranking.logger": {"fullname": "outrank.core_ranking.logger", "modulename": "outrank.core_ranking", "qualname": "logger", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;Logger syn-logger (DEBUG)&gt;"}, "outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE": {"fullname": "outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE", "modulename": "outrank.core_ranking", "qualname": "GLOBAL_CARDINALITY_STORAGE", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[typing.Any, typing.Any]", "default_value": "{}"}, "outrank.core_ranking.GLOBAL_COUNTS_STORAGE": {"fullname": "outrank.core_ranking.GLOBAL_COUNTS_STORAGE", "modulename": "outrank.core_ranking", "qualname": "GLOBAL_COUNTS_STORAGE", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[typing.Any, typing.Any]", "default_value": "{}"}, "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"fullname": "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE", "modulename": "outrank.core_ranking", "qualname": "GLOBAL_RARE_VALUE_STORAGE", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[str, typing.Any]", "default_value": "Counter()"}, "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"fullname": "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS", "modulename": "outrank.core_ranking", "qualname": "GLOBAL_PRIOR_COMB_COUNTS", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[typing.Any, int]", "default_value": "Counter()"}, "outrank.core_ranking.IGNORED_VALUES": {"fullname": "outrank.core_ranking.IGNORED_VALUES", "modulename": "outrank.core_ranking", "qualname": "IGNORED_VALUES", "kind": "variable", "doc": "<p></p>\n", "default_value": "set()"}, "outrank.core_ranking.HYPERLL_ERROR_BOUND": {"fullname": "outrank.core_ranking.HYPERLL_ERROR_BOUND", "modulename": "outrank.core_ranking", "qualname": "HYPERLL_ERROR_BOUND", "kind": "variable", "doc": "<p></p>\n", "default_value": "0.02"}, "outrank.core_ranking.MAX_FEATURES_3MR": {"fullname": "outrank.core_ranking.MAX_FEATURES_3MR", "modulename": "outrank.core_ranking", "qualname": "MAX_FEATURES_3MR", "kind": "variable", "doc": "<p></p>\n", "default_value": "10000"}, "outrank.core_ranking.prior_combinations_sample": {"fullname": "outrank.core_ranking.prior_combinations_sample", "modulename": "outrank.core_ranking", "qualname": "prior_combinations_sample", "kind": "function", "doc": "<p>Make sure only relevant subspace of combinations is selected based on prior counts</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">combinations</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, "outrank.core_ranking.get_combinations_from_columns": {"fullname": "outrank.core_ranking.get_combinations_from_columns", "modulename": "outrank.core_ranking", "qualname": "get_combinations_from_columns", "kind": "function", "doc": "<p>Return feature-feature &amp; feature-label combinations, depending on the heuristic and ranking scope</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">all_columns</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">indexes</span><span class=\"o\">.</span><span class=\"n\">base</span><span class=\"o\">.</span><span class=\"n\">Index</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, "outrank.core_ranking.mixed_rank_graph": {"fullname": "outrank.core_ranking.mixed_rank_graph", "modulename": "outrank.core_ranking", "qualname": "mixed_rank_graph", "kind": "function", "doc": "<p>Compute the full mixed rank graph corresponding to all pairwise feature interactions based on the selected heuristic</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">cpu_pool</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">BatchRankingSummary</span>:</span></span>", "funcdef": "def"}, "outrank.core_ranking.enrich_with_transformations": {"fullname": "outrank.core_ranking.enrich_with_transformations", "modulename": "outrank.core_ranking", "qualname": "enrich_with_transformations", "kind": "function", "doc": "<p>Construct a collection of new features based on pre-defined transformations/rules</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">num_col_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, "outrank.core_ranking.compute_combined_features": {"fullname": "outrank.core_ranking.compute_combined_features", "modulename": "outrank.core_ranking", "qualname": "compute_combined_features", "kind": "function", "doc": "<p>Compute higher order features via xxhash-based trick.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">is_3mr</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, "outrank.core_ranking.compute_expanded_multivalue_features": {"fullname": "outrank.core_ranking.compute_expanded_multivalue_features", "modulename": "outrank.core_ranking", "qualname": "compute_expanded_multivalue_features", "kind": "function", "doc": "<p>Compute one-hot encoded feature space based on each designated multivalue feature. E.g., feature with value \"a,b,c\" becomes three features, values of which are presence of a given value in a mutlivalue feature of choice.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, "outrank.core_ranking.compute_subfeatures": {"fullname": "outrank.core_ranking.compute_subfeatures", "modulename": "outrank.core_ranking", "qualname": "compute_subfeatures", "kind": "function", "doc": "<p>Compute derived features that are more fine-grained. Implements logic around two operators that govern feature construction.\n->: One sided construction - every value from left side is fine, separate ones from the right side feature will be considered.\n&lt;->: Two sided construction - two-sided values present. This means that each value from a is combined with each from b, forming |A|*|B| new features (one-hot encoded)</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, "outrank.core_ranking.include_noisy_features": {"fullname": "outrank.core_ranking.include_noisy_features", "modulename": "outrank.core_ranking", "qualname": "include_noisy_features", "kind": "function", "doc": "<p>Add randomized features that serve as a sanity check</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, "outrank.core_ranking.compute_coverage": {"fullname": "outrank.core_ranking.compute_coverage", "modulename": "outrank.core_ranking", "qualname": "compute_coverage", "kind": "function", "doc": "<p>Compute coverage of features, incrementally</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, "outrank.core_ranking.compute_feature_memory_consumption": {"fullname": "outrank.core_ranking.compute_feature_memory_consumption", "modulename": "outrank.core_ranking", "qualname": "compute_feature_memory_consumption", "kind": "function", "doc": "<p>An approximation of how much feature take up</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, "outrank.core_ranking.compute_value_counts": {"fullname": "outrank.core_ranking.compute_value_counts", "modulename": "outrank.core_ranking", "qualname": "compute_value_counts", "kind": "function", "doc": "<p>Update the count structure</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>, </span><span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.core_ranking.compute_cardinalities": {"fullname": "outrank.core_ranking.compute_cardinalities", "modulename": "outrank.core_ranking", "qualname": "compute_cardinalities", "kind": "function", "doc": "<p>Compute cardinalities of features, incrementally</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">max_unique_hist_constraint</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, "outrank.core_ranking.compute_bounds_increment": {"fullname": "outrank.core_ranking.compute_bounds_increment", "modulename": "outrank.core_ranking", "qualname": "compute_bounds_increment", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">numeric_column_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "outrank.core_ranking.compute_batch_ranking": {"fullname": "outrank.core_ranking.compute_batch_ranking", "modulename": "outrank.core_ranking", "qualname": "compute_batch_ranking", "kind": "function", "doc": "<p>Enrich the feature space and compute the batch importances</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">line_tmp_storage</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">numeric_column_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">cpu_pool</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">column_descriptions</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">BatchRankingSummary</span><span class=\"p\">,</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]]</span>:</span></span>", "funcdef": "def"}, "outrank.core_ranking.get_num_of_instances": {"fullname": "outrank.core_ranking.get_num_of_instances", "modulename": "outrank.core_ranking", "qualname": "get_num_of_instances", "kind": "function", "doc": "<p>Count the number of lines in a file, fast - useful for progress logging</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">fname</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">int</span>:</span></span>", "funcdef": "def"}, "outrank.core_ranking.get_grouped_df": {"fullname": "outrank.core_ranking.get_grouped_df", "modulename": "outrank.core_ranking", "qualname": "get_grouped_df", "kind": "function", "doc": "<p>A helper method that enables median-based aggregation after processing</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">importances_df_list</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, "outrank.core_ranking.checkpoint_importances_df": {"fullname": "outrank.core_ranking.checkpoint_importances_df", "modulename": "outrank.core_ranking", "qualname": "checkpoint_importances_df", "kind": "function", "doc": "<p>A helper which stores intermediary state - useful for longer runs</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">importances_batch</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, "outrank.core_ranking.estimate_importances_minibatches": {"fullname": "outrank.core_ranking.estimate_importances_minibatches", "modulename": "outrank.core_ranking", "qualname": "estimate_importances_minibatches", "kind": "function", "doc": "<p>Interaction score estimator - suitable for example for csv-like input data types.\nThis type of data is normally a single large csv, meaning that minibatch processing needs to\nhappen during incremental handling of the file (that\"s not the case for pre-separated ob data)</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_file</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">column_descriptions</span><span class=\"p\">:</span> <span class=\"nb\">list</span>,</span><span class=\"param\">\t<span class=\"n\">fw_col_mapping</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">numeric_column_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span>,</span><span class=\"param\">\t<span class=\"n\">batch_size</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">100000</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">data_encoding</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;utf-8&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">cpu_pool</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;</span><span class=\"se\">\\t</span><span class=\"s1\">&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">feature_construction_mode</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">defaultdict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, "outrank.core_selftest": {"fullname": "outrank.core_selftest", "modulename": "outrank.core_selftest", "kind": "module", "doc": "<p></p>\n"}, "outrank.core_utils": {"fullname": "outrank.core_utils", "modulename": "outrank.core_utils", "kind": "module", "doc": "<p></p>\n"}, "outrank.core_utils.pro_tips": {"fullname": "outrank.core_utils.pro_tips", "modulename": "outrank.core_utils", "qualname": "pro_tips", "kind": "variable", "doc": "<p></p>\n", "default_value": "[&#x27;OutRank can construct subfeatures; features based on subspaces. Example command argument is: --subfeature_mapping &quot;feature_a-&gt;feature_b;feature_c&lt;-&gt;feature_d;feature_c&lt;-&gt;feature_e&quot;&#x27;, &#x27;Heuristic MI-numba-randomized seems like the best of both worlds! (speed + performance).&#x27;, &#x27;Heuristic surrogate-lr performs cross-validation (internally), keep that in mind!&#x27;, &#x27;Consider running OutRank on a smaller data sample first, might be enough (--subsampling = a lot).&#x27;, &#x27;There are two types of combinations supported; unsupervised pairwise ranking (redundancies- --target_ranking_only=False), and supervised combinations - (--interaction_order &gt; 1)&#x27;, &#x27;Visualization part also includes clustering - this might be very insightful!&#x27;, &#x27;By default OutRank includes feature cardinality and coverage in feature names (card; cov)&#x27;, &#x27;Intermediary checkpoints (tmp_checkpoint.tsv) might already give you insights during longer runs.&#x27;, &#x27;In theory, you can rank redundancies of combined features (--interaction_order AND --target_ranking_only=False).&#x27;, &#x27;Give it as many threads as physically possible (--num_threads).&#x27;, &#x27;You can speed up ranking by diminishing feature buffer size (--combination_number_upper_bound determines how many ranking computations per batch will be considered). This, and --subsampling are very powerful together.&#x27;, &#x27;Want to rank feature transformations, but not sure which ones to choose? --transformers=default should serve as a solid baseline (common DS transformations included).&#x27;, &#x27;Your target can be any feature! (explaining one feature with others)&#x27;, &#x27;OutRank uses HyperLogLog for cardinality estimation - this is also a potential usecase (understanding cardinalities across different data sets).&#x27;, &#x27;Each feature is named as featureName(cardinality, coverage in percents) in the final files.&#x27;, &#x27;You can generate candidate feature transformation ranges (fw) by using --task=feature_summary_transformers.&#x27;]"}, "outrank.core_utils.write_json_dump_to_file": {"fullname": "outrank.core_utils.write_json_dump_to_file", "modulename": "outrank.core_utils", "qualname": "write_json_dump_to_file", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>, </span><span class=\"param\"><span class=\"n\">config_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, "outrank.core_utils.internal_hash": {"fullname": "outrank.core_utils.internal_hash", "modulename": "outrank.core_utils", "qualname": "internal_hash", "kind": "function", "doc": "<p>A generic internal hash used throughout ranking procedure - let's hardcode seed here for sure</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_obj</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, "outrank.core_utils.DatasetInformationStorage": {"fullname": "outrank.core_utils.DatasetInformationStorage", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage", "kind": "class", "doc": "<p>A generic class for holding properties of a given type of dataset</p>\n"}, "outrank.core_utils.DatasetInformationStorage.__init__": {"fullname": "outrank.core_utils.DatasetInformationStorage.__init__", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">data_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">column_names</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">column_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">col_delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">|</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">encoding</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">fw_map</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">|</span> <span class=\"kc\">None</span></span>)</span>"}, "outrank.core_utils.DatasetInformationStorage.data_path": {"fullname": "outrank.core_utils.DatasetInformationStorage.data_path", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.data_path", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str"}, "outrank.core_utils.DatasetInformationStorage.column_names": {"fullname": "outrank.core_utils.DatasetInformationStorage.column_names", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.column_names", "kind": "variable", "doc": "<p></p>\n", "annotation": ": list[str]"}, "outrank.core_utils.DatasetInformationStorage.column_types": {"fullname": "outrank.core_utils.DatasetInformationStorage.column_types", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.column_types", "kind": "variable", "doc": "<p></p>\n", "annotation": ": set[str]"}, "outrank.core_utils.DatasetInformationStorage.col_delimiter": {"fullname": "outrank.core_utils.DatasetInformationStorage.col_delimiter", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.col_delimiter", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str | None"}, "outrank.core_utils.DatasetInformationStorage.encoding": {"fullname": "outrank.core_utils.DatasetInformationStorage.encoding", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.encoding", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str"}, "outrank.core_utils.DatasetInformationStorage.fw_map": {"fullname": "outrank.core_utils.DatasetInformationStorage.fw_map", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.fw_map", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[str, str] | None"}, "outrank.core_utils.NumericFeatureSummary": {"fullname": "outrank.core_utils.NumericFeatureSummary", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary", "kind": "class", "doc": "<p>A generic class storing numeric feature statistics</p>\n"}, "outrank.core_utils.NumericFeatureSummary.__init__": {"fullname": "outrank.core_utils.NumericFeatureSummary.__init__", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">feature_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">minimum</span><span class=\"p\">:</span> <span class=\"nb\">float</span>,</span><span class=\"param\">\t<span class=\"n\">maximum</span><span class=\"p\">:</span> <span class=\"nb\">float</span>,</span><span class=\"param\">\t<span class=\"n\">median</span><span class=\"p\">:</span> <span class=\"nb\">float</span>,</span><span class=\"param\">\t<span class=\"n\">num_unique</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span>)</span>"}, "outrank.core_utils.NumericFeatureSummary.feature_name": {"fullname": "outrank.core_utils.NumericFeatureSummary.feature_name", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.feature_name", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str"}, "outrank.core_utils.NumericFeatureSummary.minimum": {"fullname": "outrank.core_utils.NumericFeatureSummary.minimum", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.minimum", "kind": "variable", "doc": "<p></p>\n", "annotation": ": float"}, "outrank.core_utils.NumericFeatureSummary.maximum": {"fullname": "outrank.core_utils.NumericFeatureSummary.maximum", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.maximum", "kind": "variable", "doc": "<p></p>\n", "annotation": ": float"}, "outrank.core_utils.NumericFeatureSummary.median": {"fullname": "outrank.core_utils.NumericFeatureSummary.median", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.median", "kind": "variable", "doc": "<p></p>\n", "annotation": ": float"}, "outrank.core_utils.NumericFeatureSummary.num_unique": {"fullname": "outrank.core_utils.NumericFeatureSummary.num_unique", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.num_unique", "kind": "variable", "doc": "<p></p>\n", "annotation": ": int"}, "outrank.core_utils.NominalFeatureSummary": {"fullname": "outrank.core_utils.NominalFeatureSummary", "modulename": "outrank.core_utils", "qualname": "NominalFeatureSummary", "kind": "class", "doc": "<p>A generic class storing numeric feature statistics</p>\n"}, "outrank.core_utils.NominalFeatureSummary.__init__": {"fullname": "outrank.core_utils.NominalFeatureSummary.__init__", "modulename": "outrank.core_utils", "qualname": "NominalFeatureSummary.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">feature_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">num_unique</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span>)</span>"}, "outrank.core_utils.NominalFeatureSummary.feature_name": {"fullname": "outrank.core_utils.NominalFeatureSummary.feature_name", "modulename": "outrank.core_utils", "qualname": "NominalFeatureSummary.feature_name", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str"}, "outrank.core_utils.NominalFeatureSummary.num_unique": {"fullname": "outrank.core_utils.NominalFeatureSummary.num_unique", "modulename": "outrank.core_utils", "qualname": "NominalFeatureSummary.num_unique", "kind": "variable", "doc": "<p></p>\n", "annotation": ": int"}, "outrank.core_utils.BatchRankingSummary": {"fullname": "outrank.core_utils.BatchRankingSummary", "modulename": "outrank.core_utils", "qualname": "BatchRankingSummary", "kind": "class", "doc": "<p>A generic class representing batched ranking results</p>\n"}, "outrank.core_utils.BatchRankingSummary.__init__": {"fullname": "outrank.core_utils.BatchRankingSummary.__init__", "modulename": "outrank.core_utils", "qualname": "BatchRankingSummary.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplet_scores</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">step_times</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span></span>)</span>"}, "outrank.core_utils.BatchRankingSummary.triplet_scores": {"fullname": "outrank.core_utils.BatchRankingSummary.triplet_scores", "modulename": "outrank.core_utils", "qualname": "BatchRankingSummary.triplet_scores", "kind": "variable", "doc": "<p></p>\n", "annotation": ": list[tuple[str, str, float]]"}, "outrank.core_utils.BatchRankingSummary.step_times": {"fullname": "outrank.core_utils.BatchRankingSummary.step_times", "modulename": "outrank.core_utils", "qualname": "BatchRankingSummary.step_times", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[str, typing.Any]"}, "outrank.core_utils.display_random_tip": {"fullname": "outrank.core_utils.display_random_tip", "modulename": "outrank.core_utils", "qualname": "display_random_tip", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, "outrank.core_utils.get_dataset_info": {"fullname": "outrank.core_utils.get_dataset_info", "modulename": "outrank.core_utils", "qualname": "get_dataset_info", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.core_utils.display_tool_name": {"fullname": "outrank.core_utils.display_tool_name", "modulename": "outrank.core_utils", "qualname": "display_tool_name", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, "outrank.core_utils.parse_ob_line": {"fullname": "outrank.core_utils.parse_ob_line", "modulename": "outrank.core_utils", "qualname": "parse_ob_line", "kind": "function", "doc": "<p>Outbrain line parsing - generic TSVs</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">line_string</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;</span><span class=\"se\">\\t</span><span class=\"s1\">&#39;</span>, </span><span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "outrank.core_utils.parse_ob_line_vw": {"fullname": "outrank.core_utils.parse_ob_line_vw", "modulename": "outrank.core_utils", "qualname": "parse_ob_line_vw", "kind": "function", "doc": "<p>Parse a sparse vw line into a pandas df with pre-defined namespace</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">line_string</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">fw_col_mapping</span><span class=\"o\">=</span><span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">table_header</span><span class=\"o\">=</span><span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">include_namespace_info</span><span class=\"o\">=</span><span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span> <span class=\"o\">|</span> <span class=\"kc\">None</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "outrank.core_utils.parse_ob_csv_line": {"fullname": "outrank.core_utils.parse_ob_csv_line", "modulename": "outrank.core_utils", "qualname": "parse_ob_csv_line", "kind": "function", "doc": "<p>Data can have commas within JSON field dumps</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">line_string</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;,&#39;</span>, </span><span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "outrank.core_utils.generic_line_parser": {"fullname": "outrank.core_utils.generic_line_parser", "modulename": "outrank.core_utils", "qualname": "generic_line_parser", "kind": "function", "doc": "<p>A generic method aimed to parse data from different sources.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">line_string</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">fw_col_mapping</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">table_header</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "outrank.core_utils.read_reference_json": {"fullname": "outrank.core_utils.read_reference_json", "modulename": "outrank.core_utils", "qualname": "read_reference_json", "kind": "function", "doc": "<p>A helper method for reading a JSON</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">json_path</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">dict</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "outrank.core_utils.parse_namespace": {"fullname": "outrank.core_utils.parse_namespace", "modulename": "outrank.core_utils", "qualname": "parse_namespace", "kind": "function", "doc": "<p>Parse the feature namespace for type awareness</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">namespace_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, "outrank.core_utils.read_column_names": {"fullname": "outrank.core_utils.read_column_names", "modulename": "outrank.core_utils", "qualname": "read_column_names", "kind": "function", "doc": "<p>Read the col. header</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">mapping_file</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "outrank.core_utils.parse_ob_vw_feature_information": {"fullname": "outrank.core_utils.parse_ob_vw_feature_information", "modulename": "outrank.core_utils", "qualname": "parse_ob_vw_feature_information", "kind": "function", "doc": "<p>A generic parser of ob-based data</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, "outrank.core_utils.parse_ob_raw_feature_information": {"fullname": "outrank.core_utils.parse_ob_raw_feature_information", "modulename": "outrank.core_utils", "qualname": "parse_ob_raw_feature_information", "kind": "function", "doc": "<p>A generic parser of ob-based data</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, "outrank.core_utils.parse_ob_feature_information": {"fullname": "outrank.core_utils.parse_ob_feature_information", "modulename": "outrank.core_utils", "qualname": "parse_ob_feature_information", "kind": "function", "doc": "<p>A generic parser of ob-based data</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, "outrank.core_utils.parse_csv_with_description_information": {"fullname": "outrank.core_utils.parse_csv_with_description_information", "modulename": "outrank.core_utils", "qualname": "parse_csv_with_description_information", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, "outrank.core_utils.parse_csv_raw": {"fullname": "outrank.core_utils.parse_csv_raw", "modulename": "outrank.core_utils", "qualname": "parse_csv_raw", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, "outrank.core_utils.extract_features_from_reference_JSON": {"fullname": "outrank.core_utils.extract_features_from_reference_JSON", "modulename": "outrank.core_utils", "qualname": "extract_features_from_reference_JSON", "kind": "function", "doc": "<p>Given a model's JSON, extract unique features</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">json_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">combined_features_only</span><span class=\"o\">=</span><span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"fullname": "outrank.core_utils.summarize_feature_bounds_for_transformers", "modulename": "outrank.core_utils", "qualname": "summarize_feature_bounds_for_transformers", "kind": "function", "doc": "<p>summarization auxilliary method for generating JSON-based specs</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">bounds_object_storage</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">feature_types</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">task_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">label_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">granularity</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">15</span>,</span><span class=\"param\">\t<span class=\"n\">output_summary_table_only</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.core_utils.summarize_rare_counts": {"fullname": "outrank.core_utils.summarize_rare_counts", "modulename": "outrank.core_utils", "qualname": "summarize_rare_counts", "kind": "function", "doc": "<p>Write rare values</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">term_counter</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">cardinality_object</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">object_info</span><span class=\"p\">:</span> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, "outrank.feature_transformations": {"fullname": "outrank.feature_transformations", "modulename": "outrank.feature_transformations", "kind": "module", "doc": "<p></p>\n"}, "outrank.feature_transformations.feature_transformer_vault": {"fullname": "outrank.feature_transformations.feature_transformer_vault", "modulename": "outrank.feature_transformations.feature_transformer_vault", "kind": "module", "doc": "<p></p>\n"}, "outrank.feature_transformations.feature_transformer_vault.default_transformers": {"fullname": "outrank.feature_transformations.feature_transformer_vault.default_transformers", "modulename": "outrank.feature_transformations.feature_transformer_vault.default_transformers", "kind": "module", "doc": "<p></p>\n"}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"fullname": "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS", "modulename": "outrank.feature_transformations.feature_transformer_vault.default_transformers", "qualname": "MINIMAL_TRANSFORMERS", "kind": "variable", "doc": "<p></p>\n", "default_value": "{&#x27;_tr_sqrt&#x27;: &#x27;np.sqrt(X)&#x27;, &#x27;_tr_log(x+1)&#x27;: &#x27;np.log(X + 1)&#x27;, &#x27;_tr_sqrt(abs(x))&#x27;: &#x27;np.sqrt(np.abs(X))&#x27;, &#x27;_tr_log(abs(x)+1)&#x27;: &#x27;np.log(np.abs(X) + 1)&#x27;}"}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"fullname": "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS", "modulename": "outrank.feature_transformations.feature_transformer_vault.default_transformers", "qualname": "DEFAULT_TRANSFORMERS", "kind": "variable", "doc": "<p></p>\n", "default_value": "{&#x27;_tr_sqrt&#x27;: &#x27;np.sqrt(X)&#x27;, &#x27;_tr_log(x+1)&#x27;: &#x27;np.log(X + 1)&#x27;, &#x27;_tr_sqrt(abs(x))&#x27;: &#x27;np.sqrt(np.abs(X))&#x27;, &#x27;_tr_log(abs(x)+1)&#x27;: &#x27;np.log(np.abs(X) + 1)&#x27;, &#x27;_tr_div(x,abs(x))*log(abs(x))&#x27;: &#x27;np.divide(X, np.abs(X)) * np.log(np.abs(X))&#x27;, &#x27;_tr_log(x + sqrt(pow(x,2), 1)&#x27;: &#x27;np.log(X + np.sqrt(np.power(X, 2) + 1))&#x27;, &#x27;_tr_log*sqrt&#x27;: &#x27;np.log(X + 1) * np.sqrt(X)&#x27;, &#x27;_tr_log*100&#x27;: &#x27;np.round(np.log(X + 1) * 100, 0)&#x27;, &#x27;_tr_nonzero&#x27;: &#x27;np.where(X != 0, 1, 0)&#x27;, &#x27;_tr_round(div(x,max))&#x27;: &#x27;np.round(np.divide(X, np.max(X)), 0)&#x27;}"}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers": {"fullname": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "modulename": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "kind": "module", "doc": "<p></p>\n"}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"fullname": "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS", "modulename": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "qualname": "FW_TRANSFORMERS", "kind": "variable", "doc": "<p></p>\n", "default_value": "{&#x27;_tr_sqrt&#x27;: &#x27;np.sqrt(X)&#x27;, &#x27;_tr_log(x+1)&#x27;: &#x27;np.log(X + 1)&#x27;, &#x27;_tr_sqrt(abs(x))&#x27;: &#x27;np.sqrt(np.abs(X))&#x27;, &#x27;_tr_log(abs(x)+1)&#x27;: &#x27;np.log(np.abs(X) + 1)&#x27;, &#x27;_tr_div(x,abs(x))*log(abs(x))&#x27;: &#x27;np.divide(X, np.abs(X)) * np.log(np.abs(X))&#x27;, &#x27;_tr_log(x + sqrt(pow(x,2), 1)&#x27;: &#x27;np.log(X + np.sqrt(np.power(X, 2) + 1))&#x27;, &#x27;_tr_log*sqrt&#x27;: &#x27;np.log(X + 1) * np.sqrt(X)&#x27;, &#x27;_tr_log*100&#x27;: &#x27;np.round(np.log(X + 1) * 100, 0)&#x27;, &#x27;_tr_nonzero&#x27;: &#x27;np.where(X != 0, 1, 0)&#x27;, &#x27;_tr_round(div(x,max))&#x27;: &#x27;np.round(np.divide(X, np.max(X)), 0)&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_1&#x27;: &#x27;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_1&#x27;: &#x27;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_2&#x27;: &#x27;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_2&#x27;: &#x27;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_4&#x27;: &#x27;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_4&#x27;: &#x27;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_8&#x27;: &#x27;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_8&#x27;: &#x27;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_16&#x27;: &#x27;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_16&#x27;: &#x27;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_32&#x27;: &#x27;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_32&#x27;: &#x27;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_64&#x27;: &#x27;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_64&#x27;: &#x27;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_96&#x27;: &#x27;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_96&#x27;: &#x27;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_1&#x27;: &#x27;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_1&#x27;: &#x27;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_2&#x27;: &#x27;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_2&#x27;: &#x27;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_4&#x27;: &#x27;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_4&#x27;: &#x27;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_8&#x27;: &#x27;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_8&#x27;: &#x27;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_16&#x27;: &#x27;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_16&#x27;: &#x27;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_32&#x27;: &#x27;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_32&#x27;: &#x27;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_64&#x27;: &#x27;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_64&#x27;: &#x27;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_96&#x27;: &#x27;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_96&#x27;: &#x27;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_1&#x27;: &#x27;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_1&#x27;: &#x27;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_2&#x27;: &#x27;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_2&#x27;: &#x27;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_4&#x27;: &#x27;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_4&#x27;: &#x27;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_8&#x27;: &#x27;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_8&#x27;: &#x27;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_16&#x27;: &#x27;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_16&#x27;: &#x27;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_32&#x27;: &#x27;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_32&#x27;: &#x27;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_64&#x27;: &#x27;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_64&#x27;: &#x27;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_96&#x27;: &#x27;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_96&#x27;: &#x27;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_1&#x27;: &#x27;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_1&#x27;: &#x27;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_2&#x27;: &#x27;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_2&#x27;: &#x27;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_4&#x27;: &#x27;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_4&#x27;: &#x27;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_8&#x27;: &#x27;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_8&#x27;: &#x27;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_16&#x27;: &#x27;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_16&#x27;: &#x27;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_32&#x27;: &#x27;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_32&#x27;: &#x27;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_64&#x27;: &#x27;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_64&#x27;: &#x27;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_96&#x27;: &#x27;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_96&#x27;: &#x27;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.01&#x27;: &#x27;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.01&#x27;: &#x27;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.02&#x27;: &#x27;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.02&#x27;: &#x27;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.04&#x27;: &#x27;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.04&#x27;: &#x27;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.08&#x27;: &#x27;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.08&#x27;: &#x27;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.16&#x27;: &#x27;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.16&#x27;: &#x27;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.32&#x27;: &#x27;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.32&#x27;: &#x27;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.64&#x27;: &#x27;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.64&#x27;: &#x27;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.96&#x27;: &#x27;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.96&#x27;: &#x27;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.01&#x27;: &#x27;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.01&#x27;: &#x27;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.02&#x27;: &#x27;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.02&#x27;: &#x27;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.04&#x27;: &#x27;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.04&#x27;: &#x27;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.08&#x27;: &#x27;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.08&#x27;: &#x27;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.16&#x27;: &#x27;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.16&#x27;: &#x27;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.32&#x27;: &#x27;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.32&#x27;: &#x27;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.64&#x27;: &#x27;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.64&#x27;: &#x27;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.96&#x27;: &#x27;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.96&#x27;: &#x27;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.01&#x27;: &#x27;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.01&#x27;: &#x27;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.02&#x27;: &#x27;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.02&#x27;: &#x27;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.04&#x27;: &#x27;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.04&#x27;: &#x27;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.08&#x27;: &#x27;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.08&#x27;: &#x27;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.16&#x27;: &#x27;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.16&#x27;: &#x27;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.32&#x27;: &#x27;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.32&#x27;: &#x27;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.64&#x27;: &#x27;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.64&#x27;: &#x27;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.96&#x27;: &#x27;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.96&#x27;: &#x27;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.01&#x27;: &#x27;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.01&#x27;: &#x27;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.02&#x27;: &#x27;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.02&#x27;: &#x27;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.04&#x27;: &#x27;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.04&#x27;: &#x27;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.08&#x27;: &#x27;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.08&#x27;: &#x27;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.16&#x27;: &#x27;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.16&#x27;: &#x27;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.32&#x27;: &#x27;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.32&#x27;: &#x27;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.64&#x27;: &#x27;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.64&#x27;: &#x27;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.96&#x27;: &#x27;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.96&#x27;: &#x27;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*100,0), 0))&#x27;}"}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"fullname": "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range", "modulename": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "qualname": "resolution_range", "kind": "variable", "doc": "<p></p>\n", "default_value": "[1, 10, 50, 100]"}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"fullname": "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range", "modulename": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "qualname": "greater_than_range", "kind": "variable", "doc": "<p></p>\n", "default_value": "[1, 2, 4, 8, 16, 32, 64, 96]"}, "outrank.feature_transformations.ranking_transformers": {"fullname": "outrank.feature_transformations.ranking_transformers", "modulename": "outrank.feature_transformations.ranking_transformers", "kind": "module", "doc": "<p></p>\n"}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise": {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerNoise", "kind": "class", "doc": "<p></p>\n"}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset": {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerNoise.noise_preset", "kind": "variable", "doc": "<p></p>\n"}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerNoise.construct_new_features", "kind": "function", "doc": "<p>Generate a few standard noise distributions</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>, </span><span class=\"param\"><span class=\"n\">label_column</span><span class=\"o\">=</span><span class=\"kc\">None</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric": {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric", "kind": "class", "doc": "<p></p>\n"}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">numeric_column_names</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>, </span><span class=\"param\"><span class=\"n\">preset</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;default&#39;</span></span>)</span>"}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names": {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.numeric_column_names", "kind": "variable", "doc": "<p></p>\n"}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names": {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.constructed_feature_names", "kind": "variable", "doc": "<p></p>\n", "annotation": ": set[str]"}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support": {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.max_maj_support", "kind": "variable", "doc": "<p></p>\n"}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support": {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.nan_prop_support", "kind": "variable", "doc": "<p></p>\n"}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.get_vals", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">tmp_df</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>, </span><span class=\"param\"><span class=\"n\">col_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.construct_baseline_features", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">dataframe</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.construct_new_features", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">dataframe</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, "outrank.task_generators": {"fullname": "outrank.task_generators", "modulename": "outrank.task_generators", "kind": "module", "doc": "<p></p>\n"}, "outrank.task_generators.logger": {"fullname": "outrank.task_generators.logger", "modulename": "outrank.task_generators", "qualname": "logger", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;Logger syn-logger (DEBUG)&gt;"}, "outrank.task_generators.outrank_task_generate_data_set": {"fullname": "outrank.task_generators.outrank_task_generate_data_set", "modulename": "outrank.task_generators", "qualname": "outrank_task_generate_data_set", "kind": "function", "doc": "<p>Core method for generating data sets</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.task_ranking": {"fullname": "outrank.task_ranking", "modulename": "outrank.task_ranking", "kind": "module", "doc": "<p></p>\n"}, "outrank.task_ranking.outrank_task_conduct_ranking": {"fullname": "outrank.task_ranking.outrank_task_conduct_ranking", "modulename": "outrank.task_ranking", "qualname": "outrank_task_conduct_ranking", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, "outrank.task_selftest": {"fullname": "outrank.task_selftest", "modulename": "outrank.task_selftest", "kind": "module", "doc": "<p></p>\n"}, "outrank.task_selftest.logger": {"fullname": "outrank.task_selftest.logger", "modulename": "outrank.task_selftest", "qualname": "logger", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;Logger syn-logger (DEBUG)&gt;"}, "outrank.task_selftest.conduct_self_test": {"fullname": "outrank.task_selftest.conduct_self_test", "modulename": "outrank.task_selftest", "qualname": "conduct_self_test", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.task_summary": {"fullname": "outrank.task_summary", "modulename": "outrank.task_summary", "kind": "module", "doc": "<p></p>\n"}, "outrank.task_summary.outrank_task_result_summary": {"fullname": "outrank.task_summary.outrank_task_result_summary", "modulename": "outrank.task_summary", "qualname": "outrank_task_result_summary", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.task_visualization": {"fullname": "outrank.task_visualization", "modulename": "outrank.task_visualization", "kind": "module", "doc": "<p></p>\n"}, "outrank.task_visualization.outrank_task_visualize_results": {"fullname": "outrank.task_visualization.outrank_task_visualize_results", "modulename": "outrank.task_visualization", "qualname": "outrank_task_visualize_results", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "outrank.visualizations": {"fullname": "outrank.visualizations", "modulename": "outrank.visualizations", "kind": "module", "doc": "<p></p>\n"}, "outrank.visualizations.ranking_visualization": {"fullname": "outrank.visualizations.ranking_visualization", "modulename": "outrank.visualizations.ranking_visualization", "kind": "module", "doc": "<p></p>\n"}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"fullname": "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters", "modulename": "outrank.visualizations.ranking_visualization", "qualname": "visualize_hierarchical_clusters", "kind": "function", "doc": "<p>A method for visualization of hierarchical clusters w.r.t. different linkage functions</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplet_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">output_folder</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">image_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;png&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">max_num_clusters</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">100</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"fullname": "outrank.visualizations.ranking_visualization.visualize_heatmap", "modulename": "outrank.visualizations.ranking_visualization", "qualname": "visualize_heatmap", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplets</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">output_folder</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">image_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"fullname": "outrank.visualizations.ranking_visualization.visualize_barplots", "modulename": "outrank.visualizations.ranking_visualization", "qualname": "visualize_barplots", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplets</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">output_folder</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">reference_json</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">image_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">label</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">heuristic</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, "outrank.visualizations.ranking_visualization.visualize_all": {"fullname": "outrank.visualizations.ranking_visualization.visualize_all", "modulename": "outrank.visualizations.ranking_visualization", "qualname": "visualize_all", "kind": "function", "doc": "<p>A method for visualization of the obtained feature interaction maps.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplets</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">output_folder</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">label</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">reference_json</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">image_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;png&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">heuristic</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;MI&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}}, "docInfo": {"outrank": {"qualname": 0, "fullname": 1, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 896}, "outrank.algorithms": {"qualname": 0, "fullname": 2, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.feature_ranking": {"qualname": 0, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.feature_ranking.ranking_mi_numba": {"qualname": 0, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"qualname": 2, "fullname": 9, "annotation": 0, "default_value": 0, "signature": 11, "bases": 0, "doc": 9}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"qualname": 3, "fullname": 10, "annotation": 0, "default_value": 0, "signature": 42, "bases": 0, "doc": 3}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"qualname": 2, "fullname": 9, "annotation": 0, "default_value": 0, "signature": 41, "bases": 0, "doc": 6}, "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"qualname": 2, "fullname": 9, "annotation": 0, "default_value": 0, "signature": 30, "bases": 0, "doc": 3}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"qualname": 4, "fullname": 11, "annotation": 0, "default_value": 0, "signature": 39, "bases": 0, "doc": 11}, "outrank.algorithms.importance_estimator": {"qualname": 0, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.importance_estimator.logger": {"qualname": 1, "fullname": 5, "annotation": 0, "default_value": 8, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.importance_estimator.sklearn_MI": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 31, "bases": 0, "doc": 3}, "outrank.algorithms.importance_estimator.sklearn_surrogate": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 42, "bases": 0, "doc": 3}, "outrank.algorithms.importance_estimator.numba_mi": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 31, "bases": 0, "doc": 3}, "outrank.algorithms.importance_estimator.sklearn_mi_adj": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 18, "bases": 0, "doc": 3}, "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"qualname": 4, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 22, "bases": 0, "doc": 21}, "outrank.algorithms.importance_estimator.rank_features_3MR": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 204, "bases": 0, "doc": 3}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"qualname": 4, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 42, "bases": 0, "doc": 3}, "outrank.algorithms.sketches": {"qualname": 0, "fullname": 3, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_cms": {"qualname": 0, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_cms.cms_hash": {"qualname": 2, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 21, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_cms.CountMinSketch": {"qualname": 1, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 19}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"qualname": 3, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 34, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.depth": {"qualname": 2, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.width": {"qualname": 2, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds": {"qualname": 3, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.M": {"qualname": 2, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.add": {"qualname": 2, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 26, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"qualname": 3, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 26, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.query": {"qualname": 2, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 16, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix": {"qualname": 3, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 11, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_counters_ordinary": {"qualname": 0, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"qualname": 1, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 19}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"qualname": 3, "fullname": 9, "annotation": 0, "default_value": 0, "signature": 21, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr": {"qualname": 4, "fullname": 10, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"qualname": 3, "fullname": 9, "annotation": 3, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"qualname": 3, "fullname": 9, "annotation": 0, "default_value": 0, "signature": 16, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add": {"qualname": 2, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 16, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_ultiloglog": {"qualname": 0, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 26}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache": {"qualname": 1, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"qualname": 3, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 16, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.p": {"qualname": 2, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.m": {"qualname": 2, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set": {"qualname": 3, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size": {"qualname": 3, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.width": {"qualname": 2, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag": {"qualname": 3, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add": {"qualname": 2, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 16, "bases": 0, "doc": 3}, "outrank.algorithms.synthetic_data_generators": {"qualname": 0, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.synthetic_data_generators.generator_naive": {"qualname": 0, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"qualname": 3, "fullname": 10, "annotation": 0, "default_value": 0, "signature": 27, "bases": 0, "doc": 3}, "outrank.core_ranking": {"qualname": 0, "fullname": 3, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_ranking.logger": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 8, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE": {"qualname": 3, "fullname": 6, "annotation": 5, "default_value": 1, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_ranking.GLOBAL_COUNTS_STORAGE": {"qualname": 3, "fullname": 6, "annotation": 5, "default_value": 1, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"qualname": 4, "fullname": 7, "annotation": 4, "default_value": 2, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"qualname": 4, "fullname": 7, "annotation": 4, "default_value": 2, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_ranking.IGNORED_VALUES": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 2, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_ranking.HYPERLL_ERROR_BOUND": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 2, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_ranking.MAX_FEATURES_3MR": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 1, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_ranking.prior_combinations_sample": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 75, "bases": 0, "doc": 15}, "outrank.core_ranking.get_combinations_from_columns": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 74, "bases": 0, "doc": 16}, "outrank.core_ranking.mixed_rank_graph": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 81, "bases": 0, "doc": 19}, "outrank.core_ranking.enrich_with_transformations": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 92, "bases": 0, "doc": 13}, "outrank.core_ranking.compute_combined_features": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 103, "bases": 0, "doc": 11}, "outrank.core_ranking.compute_expanded_multivalue_features": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 84, "bases": 0, "doc": 41}, "outrank.core_ranking.compute_subfeatures": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 84, "bases": 0, "doc": 70}, "outrank.core_ranking.include_noisy_features": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 73, "bases": 0, "doc": 11}, "outrank.core_ranking.compute_coverage": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 63, "bases": 0, "doc": 7}, "outrank.core_ranking.compute_feature_memory_consumption": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 63, "bases": 0, "doc": 10}, "outrank.core_ranking.compute_value_counts": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 42, "bases": 0, "doc": 6}, "outrank.core_ranking.compute_cardinalities": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 61, "bases": 0, "doc": 7}, "outrank.core_ranking.compute_bounds_increment": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 72, "bases": 0, "doc": 3}, "outrank.core_ranking.compute_batch_ranking": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 197, "bases": 0, "doc": 11}, "outrank.core_ranking.get_num_of_instances": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 19, "bases": 0, "doc": 15}, "outrank.core_ranking.get_grouped_df": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 59, "bases": 0, "doc": 12}, "outrank.core_ranking.checkpoint_importances_df": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 42, "bases": 0, "doc": 12}, "outrank.core_ranking.estimate_importances_minibatches": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 418, "bases": 0, "doc": 48}, "outrank.core_selftest": {"qualname": 0, "fullname": 3, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils": {"qualname": 0, "fullname": 3, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils.pro_tips": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 303, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils.write_json_dump_to_file": {"qualname": 5, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 30, "bases": 0, "doc": 3}, "outrank.core_utils.internal_hash": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 20, "bases": 0, "doc": 17}, "outrank.core_utils.DatasetInformationStorage": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 14}, "outrank.core_utils.DatasetInformationStorage.__init__": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 111, "bases": 0, "doc": 3}, "outrank.core_utils.DatasetInformationStorage.data_path": {"qualname": 3, "fullname": 6, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils.DatasetInformationStorage.column_names": {"qualname": 3, "fullname": 6, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils.DatasetInformationStorage.column_types": {"qualname": 3, "fullname": 6, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils.DatasetInformationStorage.col_delimiter": {"qualname": 3, "fullname": 6, "annotation": 4, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils.DatasetInformationStorage.encoding": {"qualname": 2, "fullname": 5, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils.DatasetInformationStorage.fw_map": {"qualname": 3, "fullname": 6, "annotation": 5, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils.NumericFeatureSummary": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 9}, "outrank.core_utils.NumericFeatureSummary.__init__": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 61, "bases": 0, "doc": 3}, "outrank.core_utils.NumericFeatureSummary.feature_name": {"qualname": 3, "fullname": 6, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils.NumericFeatureSummary.minimum": {"qualname": 2, "fullname": 5, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils.NumericFeatureSummary.maximum": {"qualname": 2, "fullname": 5, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils.NumericFeatureSummary.median": {"qualname": 2, "fullname": 5, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils.NumericFeatureSummary.num_unique": {"qualname": 3, "fullname": 6, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils.NominalFeatureSummary": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 9}, "outrank.core_utils.NominalFeatureSummary.__init__": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 26, "bases": 0, "doc": 3}, "outrank.core_utils.NominalFeatureSummary.feature_name": {"qualname": 3, "fullname": 6, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils.NominalFeatureSummary.num_unique": {"qualname": 3, "fullname": 6, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils.BatchRankingSummary": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 9}, "outrank.core_utils.BatchRankingSummary.__init__": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 67, "bases": 0, "doc": 3}, "outrank.core_utils.BatchRankingSummary.triplet_scores": {"qualname": 3, "fullname": 6, "annotation": 4, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils.BatchRankingSummary.step_times": {"qualname": 3, "fullname": 6, "annotation": 4, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.core_utils.display_random_tip": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 10, "bases": 0, "doc": 3}, "outrank.core_utils.get_dataset_info": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 16, "bases": 0, "doc": 3}, "outrank.core_utils.display_tool_name": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 10, "bases": 0, "doc": 3}, "outrank.core_utils.parse_ob_line": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 68, "bases": 0, "doc": 7}, "outrank.core_utils.parse_ob_line_vw": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 100, "bases": 0, "doc": 15}, "outrank.core_utils.parse_ob_csv_line": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 63, "bases": 0, "doc": 10}, "outrank.core_utils.generic_line_parser": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 100, "bases": 0, "doc": 13}, "outrank.core_utils.read_reference_json": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 27, "bases": 0, "doc": 9}, "outrank.core_utils.parse_namespace": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 46, "bases": 0, "doc": 9}, "outrank.core_utils.read_column_names": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 26, "bases": 0, "doc": 6}, "outrank.core_utils.parse_ob_vw_feature_information": {"qualname": 5, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 26, "bases": 0, "doc": 9}, "outrank.core_utils.parse_ob_raw_feature_information": {"qualname": 5, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 26, "bases": 0, "doc": 9}, "outrank.core_utils.parse_ob_feature_information": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 26, "bases": 0, "doc": 9}, "outrank.core_utils.parse_csv_with_description_information": {"qualname": 5, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 26, "bases": 0, "doc": 3}, "outrank.core_utils.parse_csv_raw": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 26, "bases": 0, "doc": 3}, "outrank.core_utils.extract_features_from_reference_JSON": {"qualname": 5, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 43, "bases": 0, "doc": 10}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"qualname": 5, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 100, "bases": 0, "doc": 10}, "outrank.core_utils.summarize_rare_counts": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 67, "bases": 0, "doc": 5}, "outrank.feature_transformations": {"qualname": 0, "fullname": 3, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.feature_transformations.feature_transformer_vault": {"qualname": 0, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.feature_transformations.feature_transformer_vault.default_transformers": {"qualname": 0, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"qualname": 2, "fullname": 10, "annotation": 0, "default_value": 56, "signature": 0, "bases": 0, "doc": 3}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"qualname": 2, "fullname": 10, "annotation": 0, "default_value": 173, "signature": 0, "bases": 0, "doc": 3}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers": {"qualname": 0, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"qualname": 2, "fullname": 10, "annotation": 0, "default_value": 4589, "signature": 0, "bases": 0, "doc": 3}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"qualname": 2, "fullname": 10, "annotation": 0, "default_value": 4, "signature": 0, "bases": 0, "doc": 3}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"qualname": 3, "fullname": 11, "annotation": 0, "default_value": 8, "signature": 0, "bases": 0, "doc": 3}, "outrank.feature_transformations.ranking_transformers": {"qualname": 0, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise": {"qualname": 1, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset": {"qualname": 3, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"qualname": 4, "fullname": 9, "annotation": 0, "default_value": 0, "signature": 47, "bases": 0, "doc": 8}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric": {"qualname": 1, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"qualname": 3, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 43, "bases": 0, "doc": 3}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names": {"qualname": 4, "fullname": 9, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names": {"qualname": 4, "fullname": 9, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support": {"qualname": 4, "fullname": 9, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support": {"qualname": 4, "fullname": 9, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"qualname": 3, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 51, "bases": 0, "doc": 3}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"qualname": 4, "fullname": 9, "annotation": 0, "default_value": 0, "signature": 39, "bases": 0, "doc": 3}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"qualname": 4, "fullname": 9, "annotation": 0, "default_value": 0, "signature": 39, "bases": 0, "doc": 3}, "outrank.task_generators": {"qualname": 0, "fullname": 3, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.task_generators.logger": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 8, "signature": 0, "bases": 0, "doc": 3}, "outrank.task_generators.outrank_task_generate_data_set": {"qualname": 5, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 11, "bases": 0, "doc": 8}, "outrank.task_ranking": {"qualname": 0, "fullname": 3, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.task_ranking.outrank_task_conduct_ranking": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 19, "bases": 0, "doc": 3}, "outrank.task_selftest": {"qualname": 0, "fullname": 3, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.task_selftest.logger": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 8, "signature": 0, "bases": 0, "doc": 3}, "outrank.task_selftest.conduct_self_test": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 7, "bases": 0, "doc": 3}, "outrank.task_summary": {"qualname": 0, "fullname": 3, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.task_summary.outrank_task_result_summary": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 11, "bases": 0, "doc": 3}, "outrank.task_visualization": {"qualname": 0, "fullname": 3, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.task_visualization.outrank_task_visualize_results": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 11, "bases": 0, "doc": 3}, "outrank.visualizations": {"qualname": 0, "fullname": 2, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.visualizations.ranking_visualization": {"qualname": 0, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 91, "bases": 0, "doc": 15}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 59, "bases": 0, "doc": 3}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 93, "bases": 0, "doc": 3}, "outrank.visualizations.ranking_visualization.visualize_all": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 135, "bases": 0, "doc": 13}}, "length": 164, "save": true}, "index": {"qualname": {"root": {"3": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}, "outrank.core_ranking.MAX_FEATURES_3MR": {"tf": 1}}, "df": 2}}}, "docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1}}, "df": 8, "n": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {"outrank.core_ranking.get_num_of_instances": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.num_unique": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.num_unique": {"tf": 1}}, "df": 3, "b": {"docs": {}, "df": 0, "a": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.algorithms.importance_estimator.numba_mi": {"tf": 1}}, "df": 3}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names": {"tf": 1}}, "df": 1, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.NumericFeatureSummary": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.minimum": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.maximum": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.median": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.num_unique": {"tf": 1}}, "df": 7}}}}}}}}}}}}}}}}}}}}, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}}, "df": 1}}}}}}}, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_ranking.include_noisy_features": {"tf": 1}}, "df": 1}, "e": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset": {"tf": 1}}, "df": 1}}}, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.NominalFeatureSummary": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.num_unique": {"tf": 1}}, "df": 4}}}}}}}}}}}}}}}}}}}}, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.NumericFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.display_tool_name": {"tf": 1}}, "df": 3, "s": {"docs": {"outrank.core_utils.DatasetInformationStorage.column_names": {"tf": 1}, "outrank.core_utils.read_column_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names": {"tf": 1}}, "df": 4, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.parse_namespace": {"tf": 1}}, "df": 1}}}}}}}, "n": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support": {"tf": 1}}, "df": 1}}, "e": {"docs": {}, "df": 0, "w": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}}, "df": 2}}}, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "q": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.num_unique": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.num_unique": {"tf": 1}}, "df": 3}}}}}}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}, "outrank.core_ranking.compute_combined_features": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}, "outrank.core_ranking.compute_coverage": {"tf": 1}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}, "outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}}, "df": 11}}}}, "b": {"docs": {"outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1}}, "df": 1, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.prior_combinations_sample": {"tf": 1}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}}, "df": 2}}}}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.compute_combined_features": {"tf": 1}}, "df": 1}}}}}}, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}}, "df": 1}}}}}}}, "u": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"outrank.task_ranking.outrank_task_conduct_ranking": {"tf": 1}, "outrank.task_selftest.conduct_self_test": {"tf": 1}}, "df": 2}}}}, "s": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}}, "df": 1}}}}}}}, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}}, "df": 3, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names": {"tf": 1}}, "df": 1}}}}}}}}}, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.depth": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.width": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.M": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.query": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix": {"tf": 1}}, "df": 10}}}}}}}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"tf": 1}}, "df": 1}}, "s": {"docs": {"outrank.core_ranking.GLOBAL_COUNTS_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 4}}}}, "l": {"docs": {"outrank.core_utils.DatasetInformationStorage.col_delimiter": {"tf": 1}}, "df": 1, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.DatasetInformationStorage.column_names": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.column_types": {"tf": 1}, "outrank.core_utils.read_column_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names": {"tf": 1}}, "df": 4, "s": {"docs": {"outrank.core_ranking.get_combinations_from_columns": {"tf": 1}}, "df": 1}}}}}, "v": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_coverage": {"tf": 1}}, "df": 1}}}}}}}, "m": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.sketches.counting_cms.cms_hash": {"tf": 1}}, "df": 1}}, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE": {"tf": 1}}, "df": 1}, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.compute_cardinalities": {"tf": 1}}, "df": 1}}}}}}}}}}}}, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_ranking.checkpoint_importances_df": {"tf": 1}}, "df": 1}}}}}}}}}, "s": {"docs": {}, "df": 0, "v": {"docs": {"outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1}, "outrank.core_utils.parse_csv_raw": {"tf": 1}}, "df": 3}}, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "s": {"docs": {"outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 1}}}}}}}}, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "y": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}}, "df": 1}, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}}, "df": 1}}}}}}}, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_ranking.enrich_with_transformations": {"tf": 1}}, "df": 1}}}}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.DatasetInformationStorage.encoding": {"tf": 1}}, "df": 1}}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}}, "df": 1}}, "e": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 3}}}}}}}, "r": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_ranking.HYPERLL_ERROR_BOUND": {"tf": 1}}, "df": 1}}}}, "x": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}}, "df": 1}}}}}}, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 1}}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 1}}, "df": 1}}}}}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_COUNTS_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1}}, "df": 3}}}}}, "e": {"docs": {}, "df": 0, "p": {"docs": {"outrank.core_utils.BatchRankingSummary.step_times": {"tf": 1}}, "df": 1}}}, "u": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 1}}, "df": 1}}}}}}}}, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1}}}}}}}}}, "r": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 1}}, "df": 1}}}}}}}, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 2}}}, "y": {"docs": {"outrank.task_summary.outrank_task_result_summary": {"tf": 1}}, "df": 1}}}}}, "p": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "t": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support": {"tf": 1}}, "df": 2}}}}}}, "k": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "n": {"docs": {"outrank.algorithms.importance_estimator.sklearn_MI": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_mi_adj": {"tf": 1}}, "df": 3}}}}}}, "e": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds": {"tf": 1}}, "df": 1}}}, "t": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set": {"tf": 1}, "outrank.task_generators.outrank_task_generate_data_set": {"tf": 1}}, "df": 2}, "l": {"docs": {}, "df": 0, "f": {"docs": {"outrank.task_selftest.conduct_self_test": {"tf": 1}}, "df": 1}}}, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size": {"tf": 1}}, "df": 1}}}, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.prior_combinations_sample": {"tf": 1}}, "df": 1}}}}}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.BatchRankingSummary.triplet_scores": {"tf": 1}}, "df": 1}}}}}}, "m": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.M": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.m": {"tf": 1}}, "df": 2, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}}, "df": 1}}}}, "l": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}}, "df": 1}}}}}}}}}, "i": {"docs": {"outrank.algorithms.importance_estimator.sklearn_MI": {"tf": 1}, "outrank.algorithms.importance_estimator.numba_mi": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_mi_adj": {"tf": 1}}, "df": 3, "x": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.mixed_rank_graph": {"tf": 1}}, "df": 1}}}, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}}}}}}, "m": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {"outrank.core_utils.NumericFeatureSummary.minimum": {"tf": 1}}, "df": 1}}, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 1}}, "df": 1}}}}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "x": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix": {"tf": 1}, "outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}}, "df": 2}}}}, "x": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr": {"tf": 1}, "outrank.core_ranking.MAX_FEATURES_3MR": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support": {"tf": 1}}, "df": 3, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {"outrank.core_utils.NumericFeatureSummary.maximum": {"tf": 1}}, "df": 1}}}}}, "p": {"docs": {"outrank.core_utils.DatasetInformationStorage.fw_map": {"tf": 1}}, "df": 1}, "j": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support": {"tf": 1}}, "df": 1}}, "e": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}}, "df": 1}}}}, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.NumericFeatureSummary.median": {"tf": 1}}, "df": 1}}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "o": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.core_utils.get_dataset_info": {"tf": 1}}, "df": 2, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1}}, "df": 4}}}}}}}}}, "i": {"docs": {}, "df": 0, "t": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1}}, "df": 8}}, "c": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.include_noisy_features": {"tf": 1}}, "df": 1}}}}, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_ranking.compute_bounds_increment": {"tf": 1}}, "df": 1}}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.get_num_of_instances": {"tf": 1}}, "df": 1}}}}}}}, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_utils.internal_hash": {"tf": 1}}, "df": 1}}}}}}}, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 4}}}}}}}}}}, "g": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.IGNORED_VALUES": {"tf": 1}}, "df": 1}}}}}}}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.importance_estimator.logger": {"tf": 1}, "outrank.core_ranking.logger": {"tf": 1}, "outrank.task_generators.logger": {"tf": 1}, "outrank.task_selftest.logger": {"tf": 1}}, "df": 4}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}}, "df": 4}}}}, "a": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "j": {"docs": {"outrank.algorithms.importance_estimator.sklearn_mi_adj": {"tf": 1}}, "df": 1}, "d": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add": {"tf": 1}}, "df": 5}}, "l": {"docs": {}, "df": 0, "l": {"docs": {"outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 1}}}, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix": {"tf": 1}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_ranking.get_num_of_instances": {"tf": 1}, "outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.core_utils.get_dataset_info": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}}, "df": 8}, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}, "outrank.task_generators.outrank_task_generate_data_set": {"tf": 1}}, "df": 2}}}, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank.core_utils.generic_line_parser": {"tf": 1}}, "df": 1}}}}}}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_COUNTS_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1}}, "df": 4}}}}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_ranking.mixed_rank_graph": {"tf": 1}}, "df": 1}}}, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.get_grouped_df": {"tf": 1}}, "df": 1}}}}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}}, "df": 1}}}}}}}, "p": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.p": {"tf": 1}}, "df": 1, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "w": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}}, "df": 1}}}}}}, "t": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_utils.DatasetInformationStorage.data_path": {"tf": 1}}, "df": 1}}, "r": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.parse_namespace": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1}, "outrank.core_utils.parse_csv_raw": {"tf": 1}}, "df": 9, "r": {"docs": {"outrank.core_utils.generic_line_parser": {"tf": 1}}, "df": 1}}}}}, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add": {"tf": 1}}, "df": 6}}}}}}}}}}}}}}}}}}}}}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1}, "outrank.core_ranking.prior_combinations_sample": {"tf": 1}}, "df": 2}}}, "o": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1, "p": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support": {"tf": 1}}, "df": 1}}, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset": {"tf": 1}}, "df": 1}}}}}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "k": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1}}, "df": 2, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.task_ranking.outrank_task_conduct_ranking": {"tf": 1}}, "df": 2}}}}, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {"outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}, "outrank.core_utils.display_random_tip": {"tf": 1}}, "df": 2}}}, "g": {"docs": {}, "df": 0, "e": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}}, "df": 2}}}, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 2}}, "w": {"docs": {"outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_csv_raw": {"tf": 1}}, "df": 2}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.read_reference_json": {"tf": 1}, "outrank.core_utils.read_column_names": {"tf": 1}}, "df": 2}}, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.read_reference_json": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 2}}}}}}}, "s": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"tf": 1}}, "df": 1}}}}}}}, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "t": {"docs": {"outrank.task_summary.outrank_task_result_summary": {"tf": 1}}, "df": 1, "s": {"docs": {"outrank.task_visualization.outrank_task_visualize_results": {"tf": 1}}, "df": 1}}}}}}}, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names": {"tf": 1}}, "df": 8, "s": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}, "outrank.core_ranking.MAX_FEATURES_3MR": {"tf": 1}, "outrank.core_ranking.compute_combined_features": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.include_noisy_features": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}}, "df": 9}, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}}, "df": 3}}}}}, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}}, "df": 9}}}}}}}}}}}}}}}}}}}}}}}}, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "g": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag": {"tf": 1}}, "df": 1}}}, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {"outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 2}}}, "i": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.write_json_dump_to_file": {"tf": 1}}, "df": 1}}}, "w": {"docs": {"outrank.core_utils.DatasetInformationStorage.fw_map": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1}}, "df": 2}, "o": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 1}}}, "h": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "h": {"docs": {"outrank.algorithms.sketches.counting_cms.cms_hash": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds": {"tf": 1}, "outrank.core_utils.internal_hash": {"tf": 1}}, "df": 3}}}, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "w": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.p": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.m": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.width": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add": {"tf": 1}}, "df": 9}}}}}}}}}}}, "l": {"docs": {"outrank.core_ranking.HYPERLL_ERROR_BOUND": {"tf": 1}}, "df": 1}}}}}}, "l": {"docs": {}, "df": 0, "l": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag": {"tf": 1}}, "df": 1}}, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 1}}}}}}}}}}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "p": {"docs": {"outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}}, "df": 1}}}}}}}, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.depth": {"tf": 1}}, "df": 1}}}, "f": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "t": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1}}, "df": 2}}}}}, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.DatasetInformationStorage.col_delimiter": {"tf": 1}}, "df": 1}}}}}}}, "s": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.parse_csv_with_description_information": {"tf": 1}}, "df": 1}}}}}}}}}}, "f": {"docs": {"outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1}}, "df": 2}, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {"outrank.core_utils.write_json_dump_to_file": {"tf": 1}}, "df": 1}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {"outrank.core_utils.DatasetInformationStorage.data_path": {"tf": 1}, "outrank.task_generators.outrank_task_generate_data_set": {"tf": 1}}, "df": 2, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.get_dataset_info": {"tf": 1}}, "df": 1, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.DatasetInformationStorage": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.data_path": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.column_names": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.column_types": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.col_delimiter": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.encoding": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.fw_map": {"tf": 1}}, "df": 8}}}}}}}}}}}}}}}}}}}}}}}}, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.display_random_tip": {"tf": 1}, "outrank.core_utils.display_tool_name": {"tf": 1}}, "df": 2}}}}}}}, "w": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.width": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.width": {"tf": 1}}, "df": 2}}}, "t": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1}}, "df": 2}}}, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size": {"tf": 1}}, "df": 2}}}}}, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.write_json_dump_to_file": {"tf": 1}}, "df": 1}}}}}, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}}, "df": 3, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.BatchRankingSummary": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.triplet_scores": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.step_times": {"tf": 1}}, "df": 4}}}}}}}}}}}}}}}}}, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}}, "df": 1}}}}}}, "r": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "s": {"docs": {"outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}}, "df": 1}}}}}}}, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr": {"tf": 1}, "outrank.core_ranking.HYPERLL_ERROR_BOUND": {"tf": 1}}, "df": 2, "s": {"docs": {"outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 2}}}}}}, "q": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.query": {"tf": 1}}, "df": 1}}}}}, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr": {"tf": 1}}, "df": 1}, "a": {"docs": {}, "df": 0, "n": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}}, "df": 1}}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.enrich_with_transformations": {"tf": 1}}, "df": 1}}}}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1}}, "df": 4}}}}}}}}}}, "i": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.BatchRankingSummary.triplet_scores": {"tf": 1}}, "df": 1}}}}}}, "i": {"docs": {}, "df": 0, "p": {"docs": {"outrank.core_utils.display_random_tip": {"tf": 1}}, "df": 1, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.BatchRankingSummary.step_times": {"tf": 1}}, "df": 1}}}}, "o": {"docs": {"outrank.core_utils.write_json_dump_to_file": {"tf": 1}}, "df": 1, "o": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_utils.display_tool_name": {"tf": 1}}, "df": 1}}}, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.DatasetInformationStorage.column_types": {"tf": 1}}, "df": 1}}}}, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "k": {"docs": {"outrank.task_generators.outrank_task_generate_data_set": {"tf": 1}, "outrank.task_ranking.outrank_task_conduct_ranking": {"tf": 1}, "outrank.task_summary.outrank_task_result_summary": {"tf": 1}, "outrank.task_visualization.outrank_task_visualize_results": {"tf": 1}}, "df": 4}}}, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {"outrank.task_selftest.conduct_self_test": {"tf": 1}}, "df": 1}}}}, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}}, "df": 2, "s": {"docs": {"outrank.core_ranking.IGNORED_VALUES": {"tf": 1}}, "df": 1}}}, "s": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}}, "df": 1}}}, "w": {"docs": {"outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}}, "df": 2}, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {"outrank.task_visualization.outrank_task_visualize_results": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 5}}}}}}}}}, "o": {"docs": {}, "df": 0, "f": {"docs": {"outrank.core_ranking.get_num_of_instances": {"tf": 1}}, "df": 1}, "b": {"docs": {"outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}}, "df": 6}, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "k": {"docs": {"outrank.task_generators.outrank_task_generate_data_set": {"tf": 1}, "outrank.task_ranking.outrank_task_conduct_ranking": {"tf": 1}, "outrank.task_summary.outrank_task_result_summary": {"tf": 1}, "outrank.task_visualization.outrank_task_visualize_results": {"tf": 1}}, "df": 4}}}}}}}, "j": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.write_json_dump_to_file": {"tf": 1}, "outrank.core_utils.read_reference_json": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 3}}}}}}, "fullname": {"root": {"3": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}, "outrank.core_ranking.MAX_FEATURES_3MR": {"tf": 1}}, "df": 2}}}, "docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1}}, "df": 8, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "k": {"docs": {"outrank": {"tf": 1}, "outrank.algorithms": {"tf": 1}, "outrank.algorithms.feature_ranking": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.algorithms.importance_estimator": {"tf": 1}, "outrank.algorithms.importance_estimator.logger": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_MI": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 1}, "outrank.algorithms.importance_estimator.numba_mi": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_mi_adj": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}, "outrank.algorithms.sketches": {"tf": 1}, "outrank.algorithms.sketches.counting_cms": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.cms_hash": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.depth": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.width": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.M": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.query": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.p": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.m": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.width": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add": {"tf": 1}, "outrank.algorithms.synthetic_data_generators": {"tf": 1}, "outrank.algorithms.synthetic_data_generators.generator_naive": {"tf": 1}, "outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}, "outrank.core_ranking": {"tf": 1}, "outrank.core_ranking.logger": {"tf": 1}, "outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_COUNTS_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1}, "outrank.core_ranking.IGNORED_VALUES": {"tf": 1}, "outrank.core_ranking.HYPERLL_ERROR_BOUND": {"tf": 1}, "outrank.core_ranking.MAX_FEATURES_3MR": {"tf": 1}, "outrank.core_ranking.prior_combinations_sample": {"tf": 1}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_ranking.compute_combined_features": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}, "outrank.core_ranking.include_noisy_features": {"tf": 1}, "outrank.core_ranking.compute_coverage": {"tf": 1}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}, "outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.core_ranking.get_num_of_instances": {"tf": 1}, "outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_selftest": {"tf": 1}, "outrank.core_utils": {"tf": 1}, "outrank.core_utils.pro_tips": {"tf": 1}, "outrank.core_utils.write_json_dump_to_file": {"tf": 1}, "outrank.core_utils.internal_hash": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.data_path": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.column_names": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.column_types": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.col_delimiter": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.encoding": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.fw_map": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.minimum": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.maximum": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.median": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.num_unique": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.num_unique": {"tf": 1}, "outrank.core_utils.BatchRankingSummary": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.triplet_scores": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.step_times": {"tf": 1}, "outrank.core_utils.display_random_tip": {"tf": 1}, "outrank.core_utils.get_dataset_info": {"tf": 1}, "outrank.core_utils.display_tool_name": {"tf": 1}, "outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}, "outrank.core_utils.read_reference_json": {"tf": 1}, "outrank.core_utils.parse_namespace": {"tf": 1}, "outrank.core_utils.read_column_names": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1}, "outrank.core_utils.parse_csv_raw": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}, "outrank.feature_transformations": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}, "outrank.feature_transformations.ranking_transformers": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}, "outrank.task_generators": {"tf": 1}, "outrank.task_generators.logger": {"tf": 1}, "outrank.task_generators.outrank_task_generate_data_set": {"tf": 1.4142135623730951}, "outrank.task_ranking": {"tf": 1}, "outrank.task_ranking.outrank_task_conduct_ranking": {"tf": 1.4142135623730951}, "outrank.task_selftest": {"tf": 1}, "outrank.task_selftest.logger": {"tf": 1}, "outrank.task_selftest.conduct_self_test": {"tf": 1}, "outrank.task_summary": {"tf": 1}, "outrank.task_summary.outrank_task_result_summary": {"tf": 1.4142135623730951}, "outrank.task_visualization": {"tf": 1}, "outrank.task_visualization.outrank_task_visualize_results": {"tf": 1.4142135623730951}, "outrank.visualizations": {"tf": 1}, "outrank.visualizations.ranking_visualization": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 164}}}}}}, "r": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add": {"tf": 1}}, "df": 7}}}}}}}, "f": {"docs": {"outrank.core_ranking.get_num_of_instances": {"tf": 1}}, "df": 1}, "b": {"docs": {"outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}}, "df": 6}}, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms": {"tf": 1}, "outrank.algorithms.feature_ranking": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.algorithms.importance_estimator": {"tf": 1}, "outrank.algorithms.importance_estimator.logger": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_MI": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 1}, "outrank.algorithms.importance_estimator.numba_mi": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_mi_adj": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}, "outrank.algorithms.sketches": {"tf": 1}, "outrank.algorithms.sketches.counting_cms": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.cms_hash": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.depth": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.width": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.M": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.query": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.p": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.m": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.width": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add": {"tf": 1}, "outrank.algorithms.synthetic_data_generators": {"tf": 1}, "outrank.algorithms.synthetic_data_generators.generator_naive": {"tf": 1}, "outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}}, "df": 50}}}}}}}}, "l": {"docs": {"outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 1}}, "d": {"docs": {}, "df": 0, "j": {"docs": {"outrank.algorithms.importance_estimator.sklearn_mi_adj": {"tf": 1}}, "df": 1}, "d": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add": {"tf": 1}}, "df": 5}}}, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.feature_ranking": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}, "outrank.feature_transformations": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault": {"tf": 1.4142135623730951}, "outrank.feature_transformations.feature_transformer_vault.default_transformers": {"tf": 1.4142135623730951}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 1.4142135623730951}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1.4142135623730951}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers": {"tf": 1.4142135623730951}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1.4142135623730951}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"tf": 1.4142135623730951}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1.4142135623730951}, "outrank.feature_transformations.ranking_transformers": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names": {"tf": 1.4142135623730951}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}}, "df": 36, "s": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}, "outrank.core_ranking.MAX_FEATURES_3MR": {"tf": 1}, "outrank.core_ranking.compute_combined_features": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.include_noisy_features": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}}, "df": 9}, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}}, "df": 3}}}}}, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}}, "df": 9}}}}}}}}}}}}}}}}}}}}}}}}, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "g": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag": {"tf": 1}}, "df": 1}}}, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {"outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 2}}}, "i": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.write_json_dump_to_file": {"tf": 1}}, "df": 1}}}, "w": {"docs": {"outrank.core_utils.DatasetInformationStorage.fw_map": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1.4142135623730951}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}}, "df": 5}, "o": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 1}}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "k": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1}}, "df": 2, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.algorithms.feature_ranking": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba": {"tf": 1.4142135623730951}, "outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1.4142135623730951}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1.4142135623730951}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1.4142135623730951}, "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 1.4142135623730951}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1.4142135623730951}, "outrank.core_ranking": {"tf": 1}, "outrank.core_ranking.logger": {"tf": 1}, "outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_COUNTS_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1}, "outrank.core_ranking.IGNORED_VALUES": {"tf": 1}, "outrank.core_ranking.HYPERLL_ERROR_BOUND": {"tf": 1}, "outrank.core_ranking.MAX_FEATURES_3MR": {"tf": 1}, "outrank.core_ranking.prior_combinations_sample": {"tf": 1}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_ranking.compute_combined_features": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}, "outrank.core_ranking.include_noisy_features": {"tf": 1}, "outrank.core_ranking.compute_coverage": {"tf": 1}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}, "outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1.4142135623730951}, "outrank.core_ranking.get_num_of_instances": {"tf": 1}, "outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.feature_transformations.ranking_transformers": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}, "outrank.task_ranking": {"tf": 1}, "outrank.task_ranking.outrank_task_conduct_ranking": {"tf": 1.4142135623730951}, "outrank.visualizations.ranking_visualization": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 54}}}}, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {"outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}, "outrank.core_utils.display_random_tip": {"tf": 1}}, "df": 2}}}, "g": {"docs": {}, "df": 0, "e": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}}, "df": 2}}}, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 2}}, "w": {"docs": {"outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_csv_raw": {"tf": 1}}, "df": 2}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.read_reference_json": {"tf": 1}, "outrank.core_utils.read_column_names": {"tf": 1}}, "df": 2}}, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.read_reference_json": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 2}}}}}}}, "s": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"tf": 1}}, "df": 1}}}}}}}, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "t": {"docs": {"outrank.task_summary.outrank_task_result_summary": {"tf": 1}}, "df": 1, "s": {"docs": {"outrank.task_visualization.outrank_task_visualize_results": {"tf": 1}}, "df": 1}}}}}}}, "m": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.M": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.m": {"tf": 1}}, "df": 2, "i": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_MI": {"tf": 1}, "outrank.algorithms.importance_estimator.numba_mi": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_mi_adj": {"tf": 1}}, "df": 9, "x": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.mixed_rank_graph": {"tf": 1}}, "df": 1}}}, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}}}}}}, "m": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {"outrank.core_utils.NumericFeatureSummary.minimum": {"tf": 1}}, "df": 1}}, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 1}}, "df": 1}}}}}}, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}}, "df": 1}}}}, "l": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}}, "df": 1}}}}}}}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "x": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix": {"tf": 1}, "outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}}, "df": 2}}}}, "x": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr": {"tf": 1}, "outrank.core_ranking.MAX_FEATURES_3MR": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support": {"tf": 1}}, "df": 3, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {"outrank.core_utils.NumericFeatureSummary.maximum": {"tf": 1}}, "df": 1}}}}}, "p": {"docs": {"outrank.core_utils.DatasetInformationStorage.fw_map": {"tf": 1}}, "df": 1}, "j": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support": {"tf": 1}}, "df": 1}}, "e": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}}, "df": 1}}}}, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.NumericFeatureSummary.median": {"tf": 1}}, "df": 1}}}}}}, "n": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {"outrank.core_ranking.get_num_of_instances": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.num_unique": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.num_unique": {"tf": 1}}, "df": 3, "b": {"docs": {}, "df": 0, "a": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1.4142135623730951}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1.4142135623730951}, "outrank.algorithms.importance_estimator.numba_mi": {"tf": 1}}, "df": 7}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names": {"tf": 1}}, "df": 1, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.NumericFeatureSummary": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.minimum": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.maximum": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.median": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.num_unique": {"tf": 1}}, "df": 7}}}}}}}}}}}}}}}}}}}}, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}}, "df": 1}}}}}}}, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_ranking.include_noisy_features": {"tf": 1}}, "df": 1}, "e": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset": {"tf": 1}}, "df": 1}}}, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.NominalFeatureSummary": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.num_unique": {"tf": 1}}, "df": 4}}}}}}}}}}}}}}}}}}}}, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.synthetic_data_generators.generator_naive": {"tf": 1}, "outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}}, "df": 2}}}, "m": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.NumericFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.display_tool_name": {"tf": 1}}, "df": 3, "s": {"docs": {"outrank.core_utils.DatasetInformationStorage.column_names": {"tf": 1}, "outrank.core_utils.read_column_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names": {"tf": 1}}, "df": 4, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.parse_namespace": {"tf": 1}}, "df": 1}}}}}}}, "n": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support": {"tf": 1}}, "df": 1}}, "e": {"docs": {}, "df": 0, "w": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}}, "df": 2}}}, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "q": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.num_unique": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.num_unique": {"tf": 1}}, "df": 3}}}}}, "l": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "g": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.p": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.m": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.width": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add": {"tf": 1}}, "df": 10}}}}}}}}}, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils": {"tf": 1}, "outrank.core_utils.pro_tips": {"tf": 1}, "outrank.core_utils.write_json_dump_to_file": {"tf": 1}, "outrank.core_utils.internal_hash": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.data_path": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.column_names": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.column_types": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.col_delimiter": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.encoding": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.fw_map": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.minimum": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.maximum": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.median": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.num_unique": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.num_unique": {"tf": 1}, "outrank.core_utils.BatchRankingSummary": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.triplet_scores": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.step_times": {"tf": 1}, "outrank.core_utils.display_random_tip": {"tf": 1}, "outrank.core_utils.get_dataset_info": {"tf": 1}, "outrank.core_utils.display_tool_name": {"tf": 1}, "outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}, "outrank.core_utils.read_reference_json": {"tf": 1}, "outrank.core_utils.parse_namespace": {"tf": 1}, "outrank.core_utils.read_column_names": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1}, "outrank.core_utils.parse_csv_raw": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 45}}}}}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}, "outrank.core_ranking.compute_combined_features": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}, "outrank.core_ranking.compute_coverage": {"tf": 1}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}, "outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}}, "df": 11}}}}, "b": {"docs": {"outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1}}, "df": 1, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.prior_combinations_sample": {"tf": 1}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}}, "df": 2}}}}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.compute_combined_features": {"tf": 1}}, "df": 1}}}}}}, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}}, "df": 1}}}}}}}, "u": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"outrank.task_ranking.outrank_task_conduct_ranking": {"tf": 1}, "outrank.task_selftest.conduct_self_test": {"tf": 1}}, "df": 2}}}}, "s": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}}, "df": 1}}}}}}}, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}}, "df": 3, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names": {"tf": 1}}, "df": 1}}}}}}}}}, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.algorithms.sketches.counting_cms": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.cms_hash": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.depth": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.width": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.M": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.query": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.p": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.m": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.width": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add": {"tf": 1}}, "df": 29}}}, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.depth": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.width": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.M": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.query": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix": {"tf": 1}}, "df": 10}}}}}}}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"tf": 1}}, "df": 1, "s": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add": {"tf": 1}}, "df": 7}}}, "s": {"docs": {"outrank.core_ranking.GLOBAL_COUNTS_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 4}}}}, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking": {"tf": 1}, "outrank.core_ranking.logger": {"tf": 1}, "outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_COUNTS_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1}, "outrank.core_ranking.IGNORED_VALUES": {"tf": 1}, "outrank.core_ranking.HYPERLL_ERROR_BOUND": {"tf": 1}, "outrank.core_ranking.MAX_FEATURES_3MR": {"tf": 1}, "outrank.core_ranking.prior_combinations_sample": {"tf": 1}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_ranking.compute_combined_features": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}, "outrank.core_ranking.include_noisy_features": {"tf": 1}, "outrank.core_ranking.compute_coverage": {"tf": 1}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}, "outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.core_ranking.get_num_of_instances": {"tf": 1}, "outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_selftest": {"tf": 1}, "outrank.core_utils": {"tf": 1}, "outrank.core_utils.pro_tips": {"tf": 1}, "outrank.core_utils.write_json_dump_to_file": {"tf": 1}, "outrank.core_utils.internal_hash": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.data_path": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.column_names": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.column_types": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.col_delimiter": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.encoding": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.fw_map": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.minimum": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.maximum": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.median": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.num_unique": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.num_unique": {"tf": 1}, "outrank.core_utils.BatchRankingSummary": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.triplet_scores": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.step_times": {"tf": 1}, "outrank.core_utils.display_random_tip": {"tf": 1}, "outrank.core_utils.get_dataset_info": {"tf": 1}, "outrank.core_utils.display_tool_name": {"tf": 1}, "outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}, "outrank.core_utils.read_reference_json": {"tf": 1}, "outrank.core_utils.parse_namespace": {"tf": 1}, "outrank.core_utils.read_column_names": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1}, "outrank.core_utils.parse_csv_raw": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 73}}, "l": {"docs": {"outrank.core_utils.DatasetInformationStorage.col_delimiter": {"tf": 1}}, "df": 1, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.DatasetInformationStorage.column_names": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.column_types": {"tf": 1}, "outrank.core_utils.read_column_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names": {"tf": 1}}, "df": 4, "s": {"docs": {"outrank.core_ranking.get_combinations_from_columns": {"tf": 1}}, "df": 1}}}}}, "v": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_coverage": {"tf": 1}}, "df": 1}}}}}}}, "m": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.sketches.counting_cms": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.cms_hash": {"tf": 1.4142135623730951}, "outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.depth": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.width": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.M": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.query": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix": {"tf": 1}}, "df": 12}}, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE": {"tf": 1}}, "df": 1}, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.compute_cardinalities": {"tf": 1}}, "df": 1}}}}}}}}}}}}, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_ranking.checkpoint_importances_df": {"tf": 1}}, "df": 1}}}}}}}}}, "s": {"docs": {}, "df": 0, "v": {"docs": {"outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1}, "outrank.core_utils.parse_csv_raw": {"tf": 1}}, "df": 3}}, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "s": {"docs": {"outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 1}}}}}}}}, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "y": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}}, "df": 1}, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}}, "df": 1}}}}}}}, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_ranking.enrich_with_transformations": {"tf": 1}}, "df": 1}}}}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.DatasetInformationStorage.encoding": {"tf": 1}}, "df": 1}}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.algorithms.importance_estimator": {"tf": 1}, "outrank.algorithms.importance_estimator.logger": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_MI": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 1}, "outrank.algorithms.importance_estimator.numba_mi": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_mi_adj": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}}, "df": 10}}, "e": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 3}}}}}}}, "r": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_ranking.HYPERLL_ERROR_BOUND": {"tf": 1}}, "df": 1}}}}, "x": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}}, "df": 1}}}}}}, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 1}}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 1}}, "df": 1}}}}}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_COUNTS_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1}}, "df": 3}}}}}, "e": {"docs": {}, "df": 0, "p": {"docs": {"outrank.core_utils.BatchRankingSummary.step_times": {"tf": 1}}, "df": 1}}}, "u": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 1}}, "df": 1}}}}}}}}, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1}}}}}}}}}, "r": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 1}}, "df": 1}}}}}}}, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 2}}}, "y": {"docs": {"outrank.task_summary": {"tf": 1}, "outrank.task_summary.outrank_task_result_summary": {"tf": 1.4142135623730951}}, "df": 2}}}}}, "p": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "t": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support": {"tf": 1}}, "df": 2}}}}}}, "k": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "n": {"docs": {"outrank.algorithms.importance_estimator.sklearn_MI": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_mi_adj": {"tf": 1}}, "df": 3}}}}}, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.sketches": {"tf": 1}, "outrank.algorithms.sketches.counting_cms": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.cms_hash": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.depth": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.width": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.M": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.query": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.p": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.m": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.width": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add": {"tf": 1}}, "df": 30}}}}}}}, "e": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds": {"tf": 1}}, "df": 1}}}, "t": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set": {"tf": 1}, "outrank.task_generators.outrank_task_generate_data_set": {"tf": 1}}, "df": 2}, "l": {"docs": {}, "df": 0, "f": {"docs": {"outrank.task_selftest.conduct_self_test": {"tf": 1}}, "df": 1, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_selftest": {"tf": 1}, "outrank.task_selftest": {"tf": 1}, "outrank.task_selftest.logger": {"tf": 1}, "outrank.task_selftest.conduct_self_test": {"tf": 1}}, "df": 4}}}}}}}, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size": {"tf": 1}}, "df": 1}}}, "y": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank.algorithms.synthetic_data_generators": {"tf": 1}, "outrank.algorithms.synthetic_data_generators.generator_naive": {"tf": 1}, "outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}}, "df": 3}}}}}}}}, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.prior_combinations_sample": {"tf": 1}}, "df": 1}}}}}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.BatchRankingSummary.triplet_scores": {"tf": 1}}, "df": 1}}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "o": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.core_utils.get_dataset_info": {"tf": 1}}, "df": 2, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1}}, "df": 4}}}}}}}}}, "i": {"docs": {}, "df": 0, "t": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1}}, "df": 8}}, "c": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.include_noisy_features": {"tf": 1}}, "df": 1}}}}, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_ranking.compute_bounds_increment": {"tf": 1}}, "df": 1}}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.get_num_of_instances": {"tf": 1}}, "df": 1}}}}}}}, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_utils.internal_hash": {"tf": 1}}, "df": 1}}}}}}}, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.importance_estimator": {"tf": 1}, "outrank.algorithms.importance_estimator.logger": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_MI": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 1}, "outrank.algorithms.importance_estimator.numba_mi": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_mi_adj": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}}, "df": 9, "s": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 4}}}}}}}}}}, "g": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.IGNORED_VALUES": {"tf": 1}}, "df": 1}}}}}}}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.importance_estimator.logger": {"tf": 1}, "outrank.core_ranking.logger": {"tf": 1}, "outrank.task_generators.logger": {"tf": 1}, "outrank.task_selftest.logger": {"tf": 1}}, "df": 4}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}}, "df": 4}}}}, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix": {"tf": 1}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_ranking.get_num_of_instances": {"tf": 1}, "outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.core_utils.get_dataset_info": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}}, "df": 8}, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.synthetic_data_generators.generator_naive": {"tf": 1}, "outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}}, "df": 2, "s": {"docs": {"outrank.algorithms.synthetic_data_generators": {"tf": 1}, "outrank.algorithms.synthetic_data_generators.generator_naive": {"tf": 1}, "outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}, "outrank.task_generators": {"tf": 1}, "outrank.task_generators.logger": {"tf": 1}, "outrank.task_generators.outrank_task_generate_data_set": {"tf": 1}}, "df": 6}}}, "e": {"docs": {"outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}, "outrank.task_generators.outrank_task_generate_data_set": {"tf": 1}}, "df": 2}}}, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank.core_utils.generic_line_parser": {"tf": 1}}, "df": 1}}}}}}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_COUNTS_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1}}, "df": 4}}}}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_ranking.mixed_rank_graph": {"tf": 1}}, "df": 1}}}, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.get_grouped_df": {"tf": 1}}, "df": 1}}}}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}}, "df": 1}}}}}}}, "p": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.p": {"tf": 1}}, "df": 1, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "w": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}}, "df": 1}}}}}}, "t": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_utils.DatasetInformationStorage.data_path": {"tf": 1}}, "df": 1}}, "r": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.parse_namespace": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1}, "outrank.core_utils.parse_csv_raw": {"tf": 1}}, "df": 9, "r": {"docs": {"outrank.core_utils.generic_line_parser": {"tf": 1}}, "df": 1}}}}}, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add": {"tf": 1}}, "df": 6}}}}}}}}}}}}}}}}}}}}}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1}, "outrank.core_ranking.prior_combinations_sample": {"tf": 1}}, "df": 2}}}, "o": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1, "p": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support": {"tf": 1}}, "df": 1}}, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset": {"tf": 1}}, "df": 1}}}}}}, "h": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "h": {"docs": {"outrank.algorithms.sketches.counting_cms.cms_hash": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds": {"tf": 1}, "outrank.core_utils.internal_hash": {"tf": 1}}, "df": 3}}}, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "w": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.p": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.m": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.width": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add": {"tf": 1}}, "df": 9}}}}}}}}}}}, "l": {"docs": {"outrank.core_ranking.HYPERLL_ERROR_BOUND": {"tf": 1}}, "df": 1}}}}}}, "l": {"docs": {}, "df": 0, "l": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag": {"tf": 1}}, "df": 1}}, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 1}}}}}}}}}}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "p": {"docs": {"outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}}, "df": 1}}}}}}}, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.depth": {"tf": 1}}, "df": 1}}}, "f": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "t": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1.4142135623730951}}, "df": 4}}}}}, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.DatasetInformationStorage.col_delimiter": {"tf": 1}}, "df": 1}}}}}}}, "s": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.parse_csv_with_description_information": {"tf": 1}}, "df": 1}}}}}}}}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {"outrank.algorithms.synthetic_data_generators": {"tf": 1}, "outrank.algorithms.synthetic_data_generators.generator_naive": {"tf": 1}, "outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.data_path": {"tf": 1}, "outrank.task_generators.outrank_task_generate_data_set": {"tf": 1}}, "df": 5, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.get_dataset_info": {"tf": 1}}, "df": 1, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.DatasetInformationStorage": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.data_path": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.column_names": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.column_types": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.col_delimiter": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.encoding": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.fw_map": {"tf": 1}}, "df": 8}}}}}}}}}}}}}}}}}}}}}}}}, "f": {"docs": {"outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1}}, "df": 2}, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {"outrank.core_utils.write_json_dump_to_file": {"tf": 1}}, "df": 1}}}, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.display_random_tip": {"tf": 1}, "outrank.core_utils.display_tool_name": {"tf": 1}}, "df": 2}}}}}}}, "w": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.width": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.width": {"tf": 1}}, "df": 2}}}, "t": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1}}, "df": 2}}}, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size": {"tf": 1}}, "df": 2}}}}}, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.write_json_dump_to_file": {"tf": 1}}, "df": 1}}}}}, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}}, "df": 3, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.BatchRankingSummary": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.triplet_scores": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.step_times": {"tf": 1}}, "df": 4}}}}}}}}}}}}}}}}}, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}}, "df": 1}}}}}}, "r": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "s": {"docs": {"outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}}, "df": 1}}}}}}}, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr": {"tf": 1}, "outrank.core_ranking.HYPERLL_ERROR_BOUND": {"tf": 1}}, "df": 2, "s": {"docs": {"outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 2}}}}}}, "q": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.query": {"tf": 1}}, "df": 1}}}}}, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr": {"tf": 1}}, "df": 1}, "a": {"docs": {}, "df": 0, "n": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}}, "df": 1}}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.feature_transformations": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}, "outrank.feature_transformations.ranking_transformers": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}}, "df": 23}}}}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.feature_transformations.feature_transformer_vault": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}}, "df": 8, "s": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 1.4142135623730951}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1.4142135623730951}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1.4142135623730951}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}, "outrank.feature_transformations.ranking_transformers": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}}, "df": 21}}}}}}}}}}, "i": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.BatchRankingSummary.triplet_scores": {"tf": 1}}, "df": 1}}}}}}, "i": {"docs": {}, "df": 0, "p": {"docs": {"outrank.core_utils.display_random_tip": {"tf": 1}}, "df": 1, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.BatchRankingSummary.step_times": {"tf": 1}}, "df": 1}}}}, "o": {"docs": {"outrank.core_utils.write_json_dump_to_file": {"tf": 1}}, "df": 1, "o": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_utils.display_tool_name": {"tf": 1}}, "df": 1}}}, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.DatasetInformationStorage.column_types": {"tf": 1}}, "df": 1}}}}, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "k": {"docs": {"outrank.task_generators": {"tf": 1}, "outrank.task_generators.logger": {"tf": 1}, "outrank.task_generators.outrank_task_generate_data_set": {"tf": 1.4142135623730951}, "outrank.task_ranking": {"tf": 1}, "outrank.task_ranking.outrank_task_conduct_ranking": {"tf": 1.4142135623730951}, "outrank.task_selftest": {"tf": 1}, "outrank.task_selftest.logger": {"tf": 1}, "outrank.task_selftest.conduct_self_test": {"tf": 1}, "outrank.task_summary": {"tf": 1}, "outrank.task_summary.outrank_task_result_summary": {"tf": 1.4142135623730951}, "outrank.task_visualization": {"tf": 1}, "outrank.task_visualization.outrank_task_visualize_results": {"tf": 1.4142135623730951}}, "df": 12}}}, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {"outrank.task_selftest.conduct_self_test": {"tf": 1}}, "df": 1}}}}, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}}, "df": 2, "s": {"docs": {"outrank.core_ranking.IGNORED_VALUES": {"tf": 1}}, "df": 1}}}, "s": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}}, "df": 1}}, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "t": {"docs": {"outrank.feature_transformations.feature_transformer_vault": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}}, "df": 8}}}}, "w": {"docs": {"outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}}, "df": 2}, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.task_visualization": {"tf": 1}, "outrank.task_visualization.outrank_task_visualize_results": {"tf": 1}, "outrank.visualizations.ranking_visualization": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 7, "s": {"docs": {"outrank.visualizations": {"tf": 1}, "outrank.visualizations.ranking_visualization": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 6}}}}}}, "e": {"docs": {"outrank.task_visualization.outrank_task_visualize_results": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 5}}}}}}}}}, "j": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.write_json_dump_to_file": {"tf": 1}, "outrank.core_utils.read_reference_json": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 3}}}}}}, "annotation": {"root": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"tf": 1}, "outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_COUNTS_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.data_path": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.column_names": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.column_types": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.col_delimiter": {"tf": 1.4142135623730951}, "outrank.core_utils.DatasetInformationStorage.encoding": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.fw_map": {"tf": 1.4142135623730951}, "outrank.core_utils.NumericFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.minimum": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.maximum": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.median": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.num_unique": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.num_unique": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.triplet_scores": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.step_times": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names": {"tf": 1}}, "df": 21, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"tf": 1}}, "df": 1}}}}}}}}}, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"tf": 1}}, "df": 1}}}}}}}, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_COUNTS_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1}}, "df": 3}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.fw_map": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.step_times": {"tf": 1}}, "df": 3}}}}}}}}, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE": {"tf": 1.4142135623730951}, "outrank.core_ranking.GLOBAL_COUNTS_STORAGE": {"tf": 1.4142135623730951}, "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.step_times": {"tf": 1}}, "df": 5}}}, "t": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_COUNTS_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.step_times": {"tf": 1}}, "df": 4}}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.num_unique": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.num_unique": {"tf": 1}}, "df": 3}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.DatasetInformationStorage.data_path": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.col_delimiter": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.encoding": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.fw_map": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.feature_name": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.triplet_scores": {"tf": 1}}, "df": 7}}, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.DatasetInformationStorage.column_types": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names": {"tf": 1}}, "df": 2}}}}}}}, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.DatasetInformationStorage.column_names": {"tf": 1}}, "df": 1}}}, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.BatchRankingSummary.triplet_scores": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}, "n": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.DatasetInformationStorage.col_delimiter": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.fw_map": {"tf": 1}}, "df": 2}}}}, "f": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.NumericFeatureSummary.minimum": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.maximum": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.median": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.triplet_scores": {"tf": 1}}, "df": 4}}}}}}}, "default_value": {"root": {"0": {"1": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 5.656854249492381}}, "df": 1}, "2": {"docs": {"outrank.core_ranking.HYPERLL_ERROR_BOUND": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 5.656854249492381}}, "df": 2}, "4": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 5.656854249492381}}, "df": 1}, "8": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 5.656854249492381}}, "df": 1}, "docs": {"outrank.core_ranking.HYPERLL_ERROR_BOUND": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 2}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 22.715633383201094}}, "df": 3}, "1": {"0": {"0": {"0": {"0": {"docs": {"outrank.core_ranking.MAX_FEATURES_3MR": {"tf": 1}}, "df": 1}, "docs": {}, "df": 0}, "docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 8.06225774829855}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"tf": 1}}, "df": 3}, "docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 8}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"tf": 1}}, "df": 2}, "6": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 8}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}}, "df": 2}, "docs": {"outrank.core_utils.pro_tips": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 1.7320508075688772}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 2.8284271247461903}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 10.198039027185569}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}}, "df": 6}, "2": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1.4142135623730951}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 5.830951894845301}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}}, "df": 3}, "3": {"2": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 8}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}}, "df": 2}, "docs": {}, "df": 0}, "4": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 5.656854249492381}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}}, "df": 2}, "5": {"0": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 8}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"tf": 1}}, "df": 2}, "docs": {}, "df": 0}, "6": {"4": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 8}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}}, "df": 2}, "docs": {}, "df": 0}, "8": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 5.656854249492381}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}}, "df": 2}, "9": {"6": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 8}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1}}, "df": 2}, "docs": {}, "df": 0}, "docs": {"outrank.algorithms.importance_estimator.logger": {"tf": 1.4142135623730951}, "outrank.core_ranking.logger": {"tf": 1.4142135623730951}, "outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_COUNTS_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1}, "outrank.core_ranking.IGNORED_VALUES": {"tf": 1}, "outrank.core_utils.pro_tips": {"tf": 1.7320508075688772}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 2.8284271247461903}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 4.795831523312719}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 12.288205727444508}, "outrank.task_generators.logger": {"tf": 1.4142135623730951}, "outrank.task_selftest.logger": {"tf": 1.4142135623730951}}, "df": 13, "l": {"docs": {}, "df": 0, "t": {"docs": {"outrank.algorithms.importance_estimator.logger": {"tf": 1}, "outrank.core_ranking.logger": {"tf": 1}, "outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 11.313708498984761}, "outrank.task_generators.logger": {"tf": 1}, "outrank.task_selftest.logger": {"tf": 1}}, "df": 6}, "o": {"docs": {}, "df": 0, "g": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 2}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 3.1622776601683795}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 11.74734012447073}}, "df": 3, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.importance_estimator.logger": {"tf": 1.4142135623730951}, "outrank.core_ranking.logger": {"tf": 1.4142135623730951}, "outrank.task_generators.logger": {"tf": 1.4142135623730951}, "outrank.task_selftest.logger": {"tf": 1.4142135623730951}}, "df": 4}}}, "*": {"1": {"0": {"0": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1}}, "df": 2}, "docs": {}, "df": 0}, "docs": {}, "df": 0}, "docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "q": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "t": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1}}, "df": 2}}}}}}, "t": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "i": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}, "r": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "s": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "n": {"docs": {"outrank.algorithms.importance_estimator.logger": {"tf": 1}, "outrank.core_ranking.logger": {"tf": 1}, "outrank.task_generators.logger": {"tf": 1}, "outrank.task_selftest.logger": {"tf": 1}}, "df": 4}}, "e": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_ranking.IGNORED_VALUES": {"tf": 1}}, "df": 1, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "e": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}, "r": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}, "u": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}, "s": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}}}}}}}}, "r": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "p": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}}}, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}, "h": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "o": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}, "q": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "t": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 2}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 2.6457513110645907}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 11.61895003862225}}, "df": 3}}}}, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "g": {"docs": {"outrank.algorithms.importance_estimator.logger": {"tf": 1}, "outrank.core_ranking.logger": {"tf": 1}, "outrank.task_generators.logger": {"tf": 1}, "outrank.task_selftest.logger": {"tf": 1}}, "df": 4}}}, "f": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}}}}, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}}, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}}, "f": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}, "v": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1.4142135623730951}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1.4142135623730951}}, "df": 2, "i": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1.4142135623730951}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1.4142135623730951}}, "df": 2}}}}}, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "g": {"docs": {}, "df": 0, "t": {"docs": {"outrank.algorithms.importance_estimator.logger": {"tf": 1}, "outrank.core_ranking.logger": {"tf": 1}, "outrank.core_utils.pro_tips": {"tf": 2}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 16}, "outrank.task_generators.logger": {"tf": 1}, "outrank.task_selftest.logger": {"tf": 1}}, "df": 6}, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}}, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}, "c": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1}, "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1}}, "df": 2}}}}}, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "i": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}, "b": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}}}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}}}, "v": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}}}}}}, "a": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.pro_tips": {"tf": 2.23606797749979}}, "df": 1, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}, "r": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.7320508075688772}}, "df": 1}, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}}}}}, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}}, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}}, "o": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}, "x": {"2": {"7": {"docs": {"outrank.core_utils.pro_tips": {"tf": 5.656854249492381}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 4}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 6.324555320336759}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 23.49468024894146}}, "df": 4}, "docs": {}, "df": 0}, "docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 2.449489742783178}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 4.795831523312719}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 23.130067012440755}}, "df": 3, "+": {"1": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1}}, "df": 3}, "docs": {}, "df": 0}}, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "k": {"docs": {"outrank.core_utils.pro_tips": {"tf": 2}}, "df": 1}}}}}}, "n": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1, "l": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}, "f": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.7320508075688772}}, "df": 1}, "r": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}}}, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 3.872983346207417}}, "df": 1, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}}}, "i": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "w": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 11.313708498984761}}, "df": 2}}, "b": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}, "t": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 2}}, "df": 1, "s": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}, "o": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}, "y": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.7320508075688772}}, "df": 1}, "u": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}, "t": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1, "x": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}}, "n": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}}, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}, "a": {"docs": {"outrank.core_utils.pro_tips": {"tf": 2.23606797749979}}, "df": 1, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}, "n": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 2}}, "df": 1}, "y": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "l": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "o": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 2}}, "df": 1}, "c": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "b": {"docs": {}, "df": 0, "s": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 2}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 2.8284271247461903}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 2.8284271247461903}}, "df": 3}}}, "i": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.7320508075688772}}, "df": 1}, "n": {"docs": {"outrank.core_utils.pro_tips": {"tf": 2.23606797749979}}, "df": 1, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}}}}}, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}}}, "c": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}, "t": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "n": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}, "x": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1.4142135623730951}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1.4142135623730951}}, "df": 2}}, "i": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1, "n": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "g": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.7320508075688772}}, "df": 1}}}}}, "q": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}}}, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}}}}}}}, "o": {"docs": {}, "df": 0, "w": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}}}}, "n": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1, "b": {"docs": {}, "df": 0, "a": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}, "o": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}, "n": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1}}, "df": 2}}}}}}, "p": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 2.449489742783178}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 4.58257569495584}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 23.08679276123039}}, "df": 3}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}, "k": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.pro_tips": {"tf": 2.23606797749979}}, "df": 1}}}}, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}}}}}}}}}, "s": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 11.313708498984761}}, "df": 1}}, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1.7320508075688772}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 11.445523142259598}}, "df": 2}}}}}, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "i": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.7320508075688772}}, "df": 1}}, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}}}}}, "w": {"docs": {}, "df": 0, "o": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.7320508075688772}}, "df": 1}}}}, "s": {"docs": {}, "df": 0, "k": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}, "m": {"docs": {}, "df": 0, "p": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "s": {"docs": {}, "df": 0, "v": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "o": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}, "r": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 2}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 3.1622776601683795}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 11.74734012447073}}, "df": 3, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}}}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}}}}}}}}}}}, "w": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "i": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}, "t": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 16.0312195418814}}, "df": 2}}}}}, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1, "f": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "c": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "w": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}, "r": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}, "h": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}}, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}, "w": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1}}, "df": 2, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1}}, "df": 2, "f": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "b": {"docs": {"outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 8}}, "df": 1}}}}, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}}, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}}}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1.4142135623730951}}, "df": 1}}}}, "k": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "p": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}}}, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}}}}}}}, "p": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}, "c": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}, "y": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {"outrank.core_utils.pro_tips": {"tf": 2}}, "df": 1, "r": {"docs": {"outrank.core_utils.pro_tips": {"tf": 1}}, "df": 1}}}}}}, "signature": {"root": {"0": {"0": {"5": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"tf": 1}}, "df": 1}, "docs": {}, "df": 0}, "docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"tf": 1}}, "df": 2}, "1": {"0": {"0": {"0": {"0": {"0": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}, "docs": {}, "df": 0}, "docs": {}, "df": 0}, "docs": {"outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 2}, "docs": {}, "df": 0}, "5": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 1}, "docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1.4142135623730951}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"tf": 1}}, "df": 4}, "2": {"0": {"0": {"0": {"0": {"docs": {"outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}}, "df": 1}, "docs": {}, "df": 0}, "docs": {}, "df": 0}, "docs": {}, "df": 0}, "docs": {}, "df": 0}, "3": {"0": {"0": {"0": {"0": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"tf": 1}}, "df": 1}, "docs": {}, "df": 0}, "docs": {}, "df": 0}, "docs": {}, "df": 0}, "2": {"7": {"6": {"8": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1}}, "df": 1}, "docs": {}, "df": 0}, "docs": {}, "df": 0}, "docs": {}, "df": 0}, "9": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1.4142135623730951}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 2}, "outrank.core_utils.parse_ob_line": {"tf": 1.4142135623730951}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1.4142135623730951}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1.4142135623730951}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1.4142135623730951}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 2.8284271247461903}}, "df": 7}, "docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_ranking.compute_combined_features": {"tf": 1}}, "df": 1}}}, "6": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1}}, "df": 1}, "8": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}, "docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 3.1622776601683795}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 5.5677643628300215}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 5.477225575051661}, "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 4.795831523312719}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 5.477225575051661}, "outrank.algorithms.importance_estimator.sklearn_MI": {"tf": 4.898979485566356}, "outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 5.656854249492381}, "outrank.algorithms.importance_estimator.numba_mi": {"tf": 4.69041575982343}, "outrank.algorithms.importance_estimator.sklearn_mi_adj": {"tf": 3.7416573867739413}, "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 4.242640687119285}, "outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 12.806248474865697}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 5.830951894845301}, "outrank.algorithms.sketches.counting_cms.cms_hash": {"tf": 4.242640687119285}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 5.291502622129181}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.add": {"tf": 4.69041575982343}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"tf": 4.69041575982343}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.query": {"tf": 3.7416573867739413}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix": {"tf": 3.1622776601683795}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"tf": 4.242640687119285}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"tf": 3.7416573867739413}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add": {"tf": 3.7416573867739413}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"tf": 3.4641016151377544}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add": {"tf": 3.7416573867739413}, "outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 4.69041575982343}, "outrank.core_ranking.prior_combinations_sample": {"tf": 8}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 7.810249675906654}, "outrank.core_ranking.mixed_rank_graph": {"tf": 8}, "outrank.core_ranking.enrich_with_transformations": {"tf": 8.54400374531753}, "outrank.core_ranking.compute_combined_features": {"tf": 9.1104335791443}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 8.246211251235321}, "outrank.core_ranking.compute_subfeatures": {"tf": 8.246211251235321}, "outrank.core_ranking.include_noisy_features": {"tf": 7.681145747868608}, "outrank.core_ranking.compute_coverage": {"tf": 7.14142842854285}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 7.14142842854285}, "outrank.core_ranking.compute_value_counts": {"tf": 5.830951894845301}, "outrank.core_ranking.compute_cardinalities": {"tf": 6.855654600401044}, "outrank.core_ranking.compute_bounds_increment": {"tf": 7.54983443527075}, "outrank.core_ranking.compute_batch_ranking": {"tf": 12.449899597988733}, "outrank.core_ranking.get_num_of_instances": {"tf": 4}, "outrank.core_ranking.get_grouped_df": {"tf": 6.855654600401044}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 5.830951894845301}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 18.16590212458495}, "outrank.core_utils.write_json_dump_to_file": {"tf": 4.898979485566356}, "outrank.core_utils.internal_hash": {"tf": 4}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 9.38083151964686}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 7}, "outrank.core_utils.NominalFeatureSummary.__init__": {"tf": 4.47213595499958}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 7.3484692283495345}, "outrank.core_utils.display_random_tip": {"tf": 3}, "outrank.core_utils.get_dataset_info": {"tf": 3.7416573867739413}, "outrank.core_utils.display_tool_name": {"tf": 3}, "outrank.core_utils.parse_ob_line": {"tf": 7.416198487095663}, "outrank.core_utils.parse_ob_line_vw": {"tf": 8.831760866327848}, "outrank.core_utils.parse_ob_csv_line": {"tf": 7.14142842854285}, "outrank.core_utils.generic_line_parser": {"tf": 8.94427190999916}, "outrank.core_utils.read_reference_json": {"tf": 4.69041575982343}, "outrank.core_utils.parse_namespace": {"tf": 6.082762530298219}, "outrank.core_utils.read_column_names": {"tf": 4.58257569495584}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 4.47213595499958}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 4.47213595499958}, "outrank.core_utils.parse_ob_feature_information": {"tf": 4.47213595499958}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 4.47213595499958}, "outrank.core_utils.parse_csv_raw": {"tf": 4.47213595499958}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 5.744562646538029}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 8.774964387392123}, "outrank.core_utils.summarize_rare_counts": {"tf": 7.211102550927978}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 6.164414002968976}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 5.744562646538029}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 6.324555320336759}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 5.656854249492381}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 5.656854249492381}, "outrank.task_generators.outrank_task_generate_data_set": {"tf": 3.1622776601683795}, "outrank.task_ranking.outrank_task_conduct_ranking": {"tf": 4}, "outrank.task_selftest.conduct_self_test": {"tf": 2.6457513110645907}, "outrank.task_summary.outrank_task_result_summary": {"tf": 3.1622776601683795}, "outrank.task_visualization.outrank_task_visualize_results": {"tf": 3.1622776601683795}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 8.366600265340756}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 6.855654600401044}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 8.602325267042627}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 10.295630140987}}, "df": 80, "a": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1}}, "df": 1, "l": {"docs": {}, "df": 0, "l": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}}, "df": 2}, "p": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "a": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}}, "df": 1}}}}, "p": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "x": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}}, "df": 2}}}}}}}}}}}}, "n": {"docs": {}, "df": 0, "y": {"docs": {"outrank.algorithms.importance_estimator.sklearn_MI": {"tf": 1.4142135623730951}, "outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 1.4142135623730951}, "outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 2.449489742783178}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}, "outrank.core_ranking.prior_combinations_sample": {"tf": 1.7320508075688772}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1.4142135623730951}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1.7320508075688772}, "outrank.core_ranking.enrich_with_transformations": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_combined_features": {"tf": 1.7320508075688772}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1.7320508075688772}, "outrank.core_ranking.compute_subfeatures": {"tf": 1.7320508075688772}, "outrank.core_ranking.include_noisy_features": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_coverage": {"tf": 1}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}, "outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 2.449489742783178}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 3.3166247903554}, "outrank.core_utils.write_json_dump_to_file": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}, "outrank.core_utils.get_dataset_info": {"tf": 1}, "outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 2}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1.7320508075688772}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}, "outrank.task_ranking.outrank_task_conduct_ranking": {"tf": 1}}, "df": 33}}, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}, "outrank.core_ranking.prior_combinations_sample": {"tf": 1}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_ranking.compute_combined_features": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}, "outrank.core_ranking.include_noisy_features": {"tf": 1}, "outrank.core_ranking.compute_coverage": {"tf": 1}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.write_json_dump_to_file": {"tf": 1}, "outrank.core_utils.get_dataset_info": {"tf": 1}, "outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}, "outrank.task_generators.outrank_task_generate_data_set": {"tf": 1}, "outrank.task_ranking.outrank_task_conduct_ranking": {"tf": 1}, "outrank.task_summary.outrank_task_result_summary": {"tf": 1}, "outrank.task_visualization.outrank_task_visualize_results": {"tf": 1}}, "df": 26}}}}, "y": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}}, "df": 4}, "c": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1.4142135623730951}}, "df": 1, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}}, "df": 1}}}}}, "u": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "s": {"docs": {"outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 1}}}}}}}, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}}, "df": 2}, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 1}}}}}, "r": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}}, "df": 2}}}}}}}, "e": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1.4142135623730951}, "outrank.core_ranking.enrich_with_transformations": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_combined_features": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_subfeatures": {"tf": 1.4142135623730951}, "outrank.core_ranking.include_noisy_features": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_coverage": {"tf": 1}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}, "outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1}, "outrank.core_utils.parse_csv_raw": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 30}}, "m": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}}, "df": 1, "s": {"docs": {"outrank.core_ranking.prior_combinations_sample": {"tf": 1}}, "df": 1}}}}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 1}}}}}}, "l": {"docs": {"outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}}, "df": 6, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1.4142135623730951}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1.4142135623730951}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1.4142135623730951}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1}}, "df": 6, "s": {"docs": {"outrank.core_ranking.get_combinations_from_columns": {"tf": 1}}, "df": 1}}}}, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}}}}}}}}, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_ranking.compute_cardinalities": {"tf": 1}}, "df": 1}}}}, "u": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}}}}}}}}, "f": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.write_json_dump_to_file": {"tf": 1}}, "df": 1}}}}}, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 3}}}}}}}}}}, "p": {"docs": {}, "df": 0, "u": {"docs": {"outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 3}}}, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add": {"tf": 1}}, "df": 1, "u": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add": {"tf": 1}}, "df": 2, "s": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 1}}, "df": 3}}}}, "r": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}}, "df": 1}}, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.importance_estimator.sklearn_MI": {"tf": 1.4142135623730951}, "outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 1.4142135623730951}, "outrank.algorithms.importance_estimator.numba_mi": {"tf": 1.4142135623730951}, "outrank.algorithms.importance_estimator.sklearn_mi_adj": {"tf": 1.4142135623730951}}, "df": 4}}}}}}, "s": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}}, "df": 1}}}}, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {"outrank.algorithms.importance_estimator.sklearn_MI": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 1}, "outrank.algorithms.importance_estimator.numba_mi": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_mi_adj": {"tf": 1}}, "df": 4}}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.algorithms.sketches.counting_cms.cms_hash": {"tf": 1}}, "df": 1}}, "l": {"docs": {}, "df": 0, "f": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.query": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}}, "df": 11}}, "t": {"docs": {"outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_ranking.compute_coverage": {"tf": 1}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}, "outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1.7320508075688772}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1.7320508075688772}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.parse_namespace": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1}}, "df": 10}}, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 1}}, "df": 1}}}}}}}, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 1}}}}}}, "t": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 1}, "outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1.4142135623730951}, "outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_ranking.compute_coverage": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_bounds_increment": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_batch_ranking": {"tf": 2.6457513110645907}, "outrank.core_ranking.get_num_of_instances": {"tf": 1}, "outrank.core_ranking.get_grouped_df": {"tf": 1.4142135623730951}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1.4142135623730951}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 3.7416573867739413}, "outrank.core_utils.write_json_dump_to_file": {"tf": 1}, "outrank.core_utils.internal_hash": {"tf": 1.4142135623730951}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 2.6457513110645907}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1.7320508075688772}, "outrank.core_utils.parse_ob_line": {"tf": 1.7320508075688772}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1.7320508075688772}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1.7320508075688772}, "outrank.core_utils.generic_line_parser": {"tf": 1.4142135623730951}, "outrank.core_utils.read_reference_json": {"tf": 1}, "outrank.core_utils.parse_namespace": {"tf": 2}, "outrank.core_utils.read_column_names": {"tf": 1.4142135623730951}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1.7320508075688772}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1.4142135623730951}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1.4142135623730951}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1.4142135623730951}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 2.23606797749979}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 2.23606797749979}}, "df": 32, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.algorithms.importance_estimator.numba_mi": {"tf": 1}}, "df": 1}}}}}, "e": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "y": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}}, "df": 1}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}}, "df": 4}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 2}}}}}, "e": {"docs": {}, "df": 0, "p": {"docs": {"outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}}, "df": 1}}}, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.algorithms.importance_estimator.numba_mi": {"tf": 1}}, "df": 1}}}}}}}, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 2}}}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}}, "df": 1}}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}}, "df": 1}}}}}, "t": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"tf": 1}, "outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.core_ranking.get_num_of_instances": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 8}, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "x": {"docs": {"outrank.core_ranking.get_combinations_from_columns": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.get_combinations_from_columns": {"tf": 1}}, "df": 1}}}}}, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_ranking.compute_combined_features": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}, "outrank.core_ranking.include_noisy_features": {"tf": 1}, "outrank.core_ranking.compute_coverage": {"tf": 1}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}, "outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.internal_hash": {"tf": 1}}, "df": 13}}}, "c": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.parse_ob_line_vw": {"tf": 1}}, "df": 1}}}}}, "f": {"docs": {}, "df": 0, "o": {"docs": {"outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 2}}}, "s": {"docs": {"outrank.core_ranking.compute_combined_features": {"tf": 1}}, "df": 1}, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1}}, "df": 2}}}}}}}}}, "a": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {"outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 4}}}}}, "p": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "b": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}}, "df": 1}}, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1}}, "df": 1}}}}}, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.enrich_with_transformations": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_combined_features": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_subfeatures": {"tf": 1.4142135623730951}, "outrank.core_ranking.include_noisy_features": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_coverage": {"tf": 1}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}, "outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 23}}}}, "t": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.read_reference_json": {"tf": 1}, "outrank.core_utils.parse_namespace": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1}, "outrank.core_utils.parse_csv_raw": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 9}}}, "o": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 3}}}, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.compute_combined_features": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}, "outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}}, "df": 6}}}, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 2}}}, "n": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1}}, "df": 1}}}}, "e": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1}, "outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1.7320508075688772}, "outrank.core_utils.write_json_dump_to_file": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1.4142135623730951}, "outrank.core_utils.display_random_tip": {"tf": 1}, "outrank.core_utils.display_tool_name": {"tf": 1}, "outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 2}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1.7320508075688772}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.task_ranking.outrank_task_conduct_ranking": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 19}}}, "u": {"docs": {}, "df": 0, "m": {"docs": {"outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}, "outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.__init__": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 5, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1}}, "df": 4}}}}}}, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.write_json_dump_to_file": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1.4142135623730951}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}}, "df": 5, "s": {"docs": {"outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1}}, "df": 2, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_namespace": {"tf": 1}}, "df": 2}}}}}}}}}, "x": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 1.4142135623730951}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.cms_hash": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.query": {"tf": 1}}, "df": 6}, "e": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}}, "df": 1}}}}}, "r": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"tf": 1}}, "df": 1}}}}, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}}, "df": 2}}}}}}}}, "f": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1.4142135623730951}, "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 1}}, "df": 2, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}}, "df": 2}}}}, "l": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.core_ranking.compute_combined_features": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 6}}}}, "i": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {"outrank.algorithms.importance_estimator.sklearn_MI": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 1}, "outrank.algorithms.importance_estimator.numba_mi": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_mi_adj": {"tf": 1}}, "df": 4}}}, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.read_column_names": {"tf": 1}}, "df": 2}}}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {"outrank.algorithms.importance_estimator.sklearn_MI": {"tf": 1}, "outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 1}, "outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1.7320508075688772}, "outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1.7320508075688772}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}}, "df": 7}}}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.enrich_with_transformations": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_combined_features": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_subfeatures": {"tf": 1.4142135623730951}, "outrank.core_ranking.include_noisy_features": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_coverage": {"tf": 1}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}, "outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 22}}}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 4, "s": {"docs": {"outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 2}}}}}}}, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.get_num_of_instances": {"tf": 1}}, "df": 1}}}}, "w": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}}, "df": 4}, "o": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 4}}}}, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {"outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 4}}}}}}, "m": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1}}, "df": 1, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1, "l": {"docs": {"outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 1}}, "df": 1}}}}, "i": {"docs": {"outrank.algorithms.importance_estimator.numba_mi": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 2, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {"outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}}, "df": 1}}}}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}}, "df": 2}}}}}, "a": {"docs": {}, "df": 0, "x": {"docs": {"outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 2, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {"outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}}, "df": 1}}}}}, "p": {"docs": {"outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}}, "df": 1, "p": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}, "outrank.core_utils.read_column_names": {"tf": 1}}, "df": 4}}}}}}}, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank.algorithms.importance_estimator.numba_mi": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 3}}}}}}}, "a": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}}, "df": 2}}}}}, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_ranking.compute_cardinalities": {"tf": 1}}, "df": 1}}}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {"outrank.algorithms.importance_estimator.numba_mi": {"tf": 1}}, "df": 1}}, "e": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"tf": 1}}, "df": 1}}}, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}}, "df": 1}}}}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}}, "df": 1}}}}}}}}, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "y": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}}, "df": 1}}}}}}}}, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 2}}}}}}}}}, "t": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.parse_ob_line": {"tf": 1}}, "df": 2, "m": {"docs": {}, "df": 0, "p": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}}, "df": 4}}, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1.4142135623730951}, "outrank.core_ranking.prior_combinations_sample": {"tf": 1.4142135623730951}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}, "outrank.core_utils.parse_namespace": {"tf": 1}}, "df": 9}}}}, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 2.449489742783178}, "outrank.core_ranking.prior_combinations_sample": {"tf": 1.4142135623730951}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1.4142135623730951}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 2.8284271247461903}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 9}}}, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 6}}}}, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 2, "s": {"docs": {"outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 3}}}}}}}, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}}, "df": 1}}}}, "a": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 3}}}, "s": {"docs": {}, "df": 0, "k": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 1}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {"outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 1}}}}, "d": {"docs": {}, "df": 0, "f": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}, "outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}}, "df": 4}, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 2.449489742783178}, "outrank.core_ranking.compute_coverage": {"tf": 1}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}, "outrank.core_ranking.compute_bounds_increment": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1.7320508075688772}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 2.8284271247461903}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}, "outrank.core_utils.read_reference_json": {"tf": 1.4142135623730951}, "outrank.core_utils.parse_namespace": {"tf": 1}}, "df": 10}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1}, "outrank.core_utils.parse_csv_raw": {"tf": 1}}, "df": 7, "f": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1.4142135623730951}, "outrank.core_ranking.enrich_with_transformations": {"tf": 1.7320508075688772}, "outrank.core_ranking.compute_combined_features": {"tf": 1.7320508075688772}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1.7320508075688772}, "outrank.core_ranking.compute_subfeatures": {"tf": 1.7320508075688772}, "outrank.core_ranking.include_noisy_features": {"tf": 1.7320508075688772}, "outrank.core_ranking.compute_coverage": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_value_counts": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_cardinalities": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_bounds_increment": {"tf": 1.4142135623730951}, "outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1.4142135623730951}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1.4142135623730951}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1.4142135623730951}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1.4142135623730951}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 22}}}}}, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1}, "outrank.core_utils.parse_csv_raw": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 6}}}}}}}}}}}}}}}}}}}}}}}}, "e": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1}}, "df": 1}}}, "l": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.add": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"tf": 1}}, "df": 2}}, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}}, "df": 6}}}}}}}, "s": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 2}}}}}}}}}}, "f": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "t": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1}}, "df": 1, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}}}}}}}}}}, "b": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {"outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1}}, "df": 1}}}, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {"outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"tf": 1}}, "df": 1, "s": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 1}}}}, "o": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_ranking.compute_combined_features": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 3}}}, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.get_combinations_from_columns": {"tf": 1}}, "df": 1}}, "t": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_ranking.checkpoint_importances_df": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 2, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}}, "df": 2}}}}}}}}}}}}}}}}}}}, "w": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {"outrank.algorithms.sketches.counting_cms.cms_hash": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1}}, "df": 2}}}}}, "l": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"tf": 1}}, "df": 2}}, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_ranking.prior_combinations_sample": {"tf": 1.4142135623730951}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1.7320508075688772}, "outrank.core_ranking.get_grouped_df": {"tf": 1.4142135623730951}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 2.23606797749979}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1}, "outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}, "outrank.core_utils.read_column_names": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 14}}, "n": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}}, "df": 5}}}, "o": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_ranking.compute_combined_features": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}, "outrank.core_ranking.include_noisy_features": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 7}}}}}, "a": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 4}}}}}, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "k": {"docs": {"outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1}, "outrank.core_utils.parse_csv_raw": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 8}}}}, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 5}}}}}, "b": {"docs": {}, "df": 0, "j": {"docs": {"outrank.core_utils.internal_hash": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1.4142135623730951}}, "df": 2}}}}}, "n": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 2}}}}, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1}, "outrank.core_utils.parse_csv_raw": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 8}}}, "f": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "q": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary.__init__": {"tf": 1}}, "df": 3}}}}}}, "j": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.read_reference_json": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 4}}}}, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 1}}}}}}}}}}}}}, "bases": {"root": {"docs": {}, "df": 0}}, "doc": {"root": {"0": {"docs": {"outrank": {"tf": 4}}, "df": 1}, "1": {"2": {"5": {"docs": {"outrank": {"tf": 1}}, "df": 1}, "docs": {}, "df": 0}, "docs": {"outrank": {"tf": 4.358898943540674}}, "df": 1}, "2": {"docs": {"outrank": {"tf": 1}}, "df": 1}, "5": {"1": {"2": {"docs": {"outrank": {"tf": 1}}, "df": 1}, "docs": {}, "df": 0}, "docs": {}, "df": 0}, "docs": {"outrank": {"tf": 24.20743687382041}, "outrank.algorithms": {"tf": 1.7320508075688772}, "outrank.algorithms.feature_ranking": {"tf": 1.7320508075688772}, "outrank.algorithms.feature_ranking.ranking_mi_numba": {"tf": 1.7320508075688772}, "outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1.4142135623730951}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy": {"tf": 1.7320508075688772}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1.4142135623730951}, "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling": {"tf": 1.7320508075688772}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1.4142135623730951}, "outrank.algorithms.importance_estimator": {"tf": 1.7320508075688772}, "outrank.algorithms.importance_estimator.logger": {"tf": 1.7320508075688772}, "outrank.algorithms.importance_estimator.sklearn_MI": {"tf": 1.7320508075688772}, "outrank.algorithms.importance_estimator.sklearn_surrogate": {"tf": 1.7320508075688772}, "outrank.algorithms.importance_estimator.numba_mi": {"tf": 1.7320508075688772}, "outrank.algorithms.importance_estimator.sklearn_mi_adj": {"tf": 1.7320508075688772}, "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1.7320508075688772}, "outrank.algorithms.importance_estimator.rank_features_3MR": {"tf": 1.7320508075688772}, "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_cms": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_cms.cms_hash": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.depth": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.width": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.M": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.add": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.query": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_counters_ordinary": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1.4142135623730951}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.p": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.m": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.width": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add": {"tf": 1.7320508075688772}, "outrank.algorithms.synthetic_data_generators": {"tf": 1.7320508075688772}, "outrank.algorithms.synthetic_data_generators.generator_naive": {"tf": 1.7320508075688772}, "outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix": {"tf": 1.7320508075688772}, "outrank.core_ranking": {"tf": 1.7320508075688772}, "outrank.core_ranking.logger": {"tf": 1.7320508075688772}, "outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE": {"tf": 1.7320508075688772}, "outrank.core_ranking.GLOBAL_COUNTS_STORAGE": {"tf": 1.7320508075688772}, "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE": {"tf": 1.7320508075688772}, "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS": {"tf": 1.7320508075688772}, "outrank.core_ranking.IGNORED_VALUES": {"tf": 1.7320508075688772}, "outrank.core_ranking.HYPERLL_ERROR_BOUND": {"tf": 1.7320508075688772}, "outrank.core_ranking.MAX_FEATURES_3MR": {"tf": 1.7320508075688772}, "outrank.core_ranking.prior_combinations_sample": {"tf": 1.4142135623730951}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1.4142135623730951}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1.4142135623730951}, "outrank.core_ranking.enrich_with_transformations": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_combined_features": {"tf": 1.7320508075688772}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1.7320508075688772}, "outrank.core_ranking.compute_subfeatures": {"tf": 2.23606797749979}, "outrank.core_ranking.include_noisy_features": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_coverage": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_value_counts": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_cardinalities": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_bounds_increment": {"tf": 1.7320508075688772}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1.4142135623730951}, "outrank.core_ranking.get_num_of_instances": {"tf": 1.4142135623730951}, "outrank.core_ranking.get_grouped_df": {"tf": 1.4142135623730951}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1.4142135623730951}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1.7320508075688772}, "outrank.core_selftest": {"tf": 1.7320508075688772}, "outrank.core_utils": {"tf": 1.7320508075688772}, "outrank.core_utils.pro_tips": {"tf": 1.7320508075688772}, "outrank.core_utils.write_json_dump_to_file": {"tf": 1.7320508075688772}, "outrank.core_utils.internal_hash": {"tf": 1.4142135623730951}, "outrank.core_utils.DatasetInformationStorage": {"tf": 1.4142135623730951}, "outrank.core_utils.DatasetInformationStorage.__init__": {"tf": 1.7320508075688772}, "outrank.core_utils.DatasetInformationStorage.data_path": {"tf": 1.7320508075688772}, "outrank.core_utils.DatasetInformationStorage.column_names": {"tf": 1.7320508075688772}, "outrank.core_utils.DatasetInformationStorage.column_types": {"tf": 1.7320508075688772}, "outrank.core_utils.DatasetInformationStorage.col_delimiter": {"tf": 1.7320508075688772}, "outrank.core_utils.DatasetInformationStorage.encoding": {"tf": 1.7320508075688772}, "outrank.core_utils.DatasetInformationStorage.fw_map": {"tf": 1.7320508075688772}, "outrank.core_utils.NumericFeatureSummary": {"tf": 1.4142135623730951}, "outrank.core_utils.NumericFeatureSummary.__init__": {"tf": 1.7320508075688772}, "outrank.core_utils.NumericFeatureSummary.feature_name": {"tf": 1.7320508075688772}, "outrank.core_utils.NumericFeatureSummary.minimum": {"tf": 1.7320508075688772}, "outrank.core_utils.NumericFeatureSummary.maximum": {"tf": 1.7320508075688772}, "outrank.core_utils.NumericFeatureSummary.median": {"tf": 1.7320508075688772}, "outrank.core_utils.NumericFeatureSummary.num_unique": {"tf": 1.7320508075688772}, "outrank.core_utils.NominalFeatureSummary": {"tf": 1.4142135623730951}, "outrank.core_utils.NominalFeatureSummary.__init__": {"tf": 1.7320508075688772}, "outrank.core_utils.NominalFeatureSummary.feature_name": {"tf": 1.7320508075688772}, "outrank.core_utils.NominalFeatureSummary.num_unique": {"tf": 1.7320508075688772}, "outrank.core_utils.BatchRankingSummary": {"tf": 1.4142135623730951}, "outrank.core_utils.BatchRankingSummary.__init__": {"tf": 1.7320508075688772}, "outrank.core_utils.BatchRankingSummary.triplet_scores": {"tf": 1.7320508075688772}, "outrank.core_utils.BatchRankingSummary.step_times": {"tf": 1.7320508075688772}, "outrank.core_utils.display_random_tip": {"tf": 1.7320508075688772}, "outrank.core_utils.get_dataset_info": {"tf": 1.7320508075688772}, "outrank.core_utils.display_tool_name": {"tf": 1.7320508075688772}, "outrank.core_utils.parse_ob_line": {"tf": 1.4142135623730951}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1.4142135623730951}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1.4142135623730951}, "outrank.core_utils.generic_line_parser": {"tf": 1.7320508075688772}, "outrank.core_utils.read_reference_json": {"tf": 1.4142135623730951}, "outrank.core_utils.parse_namespace": {"tf": 1.4142135623730951}, "outrank.core_utils.read_column_names": {"tf": 1.4142135623730951}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1.4142135623730951}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1.4142135623730951}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1.4142135623730951}, "outrank.core_utils.parse_csv_with_description_information": {"tf": 1.7320508075688772}, "outrank.core_utils.parse_csv_raw": {"tf": 1.7320508075688772}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1.4142135623730951}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1.4142135623730951}, "outrank.core_utils.summarize_rare_counts": {"tf": 1.4142135623730951}, "outrank.feature_transformations": {"tf": 1.7320508075688772}, "outrank.feature_transformations.feature_transformer_vault": {"tf": 1.7320508075688772}, "outrank.feature_transformations.feature_transformer_vault.default_transformers": {"tf": 1.7320508075688772}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS": {"tf": 1.7320508075688772}, "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS": {"tf": 1.7320508075688772}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers": {"tf": 1.7320508075688772}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS": {"tf": 1.7320508075688772}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range": {"tf": 1.7320508075688772}, "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range": {"tf": 1.7320508075688772}, "outrank.feature_transformations.ranking_transformers": {"tf": 1.7320508075688772}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise": {"tf": 1.7320508075688772}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset": {"tf": 1.7320508075688772}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1.4142135623730951}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric": {"tf": 1.7320508075688772}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__": {"tf": 1.7320508075688772}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names": {"tf": 1.7320508075688772}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names": {"tf": 1.7320508075688772}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support": {"tf": 1.7320508075688772}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support": {"tf": 1.7320508075688772}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals": {"tf": 1.7320508075688772}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features": {"tf": 1.7320508075688772}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features": {"tf": 1.7320508075688772}, "outrank.task_generators": {"tf": 1.7320508075688772}, "outrank.task_generators.logger": {"tf": 1.7320508075688772}, "outrank.task_generators.outrank_task_generate_data_set": {"tf": 1.4142135623730951}, "outrank.task_ranking": {"tf": 1.7320508075688772}, "outrank.task_ranking.outrank_task_conduct_ranking": {"tf": 1.7320508075688772}, "outrank.task_selftest": {"tf": 1.7320508075688772}, "outrank.task_selftest.logger": {"tf": 1.7320508075688772}, "outrank.task_selftest.conduct_self_test": {"tf": 1.7320508075688772}, "outrank.task_summary": {"tf": 1.7320508075688772}, "outrank.task_summary.outrank_task_result_summary": {"tf": 1.7320508075688772}, "outrank.task_visualization": {"tf": 1.7320508075688772}, "outrank.task_visualization.outrank_task_visualize_results": {"tf": 1.7320508075688772}, "outrank.visualizations": {"tf": 1.7320508075688772}, "outrank.visualizations.ranking_visualization": {"tf": 1.7320508075688772}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1.4142135623730951}, "outrank.visualizations.ranking_visualization.visualize_heatmap": {"tf": 1.7320508075688772}, "outrank.visualizations.ranking_visualization.visualize_barplots": {"tf": 1.7320508075688772}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1.7320508075688772}}, "df": 164, "w": {"docs": {"outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1}}, "df": 4}}}}, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {"outrank": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}}, "df": 6, "i": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.parse_ob_csv_line": {"tf": 1}}, "df": 1}}}}, "l": {"docs": {}, "df": 0, "l": {"docs": {"outrank": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 2}}}, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 1}}}}}, "t": {"docs": {"outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 1, "o": {"docs": {"outrank": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}}, "df": 5, "o": {"docs": {}, "df": 0, "l": {"docs": {"outrank": {"tf": 1.4142135623730951}}, "df": 1}}}, "h": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 2.449489742783178}, "outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1.4142135623730951}, "outrank.core_ranking.get_num_of_instances": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1.4142135623730951}, "outrank.core_utils.parse_namespace": {"tf": 1}, "outrank.core_utils.read_column_names": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 14}, "i": {"docs": {}, "df": 0, "s": {"docs": {"outrank": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 4}}, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}}, "df": 1}}, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.internal_hash": {"tf": 1}}, "df": 1}}}}}}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1.7320508075688772}, "outrank.core_ranking.include_noisy_features": {"tf": 1}, "outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1.4142135623730951}}, "df": 4}}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "/": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.enrich_with_transformations": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}}}}}, "i": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "s": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}, "c": {"docs": {}, "df": 0, "k": {"docs": {"outrank.core_ranking.compute_combined_features": {"tf": 1}}, "df": 1}}}}, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "k": {"docs": {"outrank": {"tf": 1}}, "df": 1}}, "k": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}}, "df": 1}}}, "w": {"docs": {}, "df": 0, "o": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1.7320508075688772}}, "df": 1}}, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage": {"tf": 1}, "outrank.core_utils.parse_namespace": {"tf": 1}}, "df": 3, "s": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}}}, "s": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.parse_ob_line": {"tf": 1}}, "df": 1}}}}, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "k": {"docs": {"outrank": {"tf": 3.1622776601683795}}, "df": 1}}}}, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "s": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}, "b": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.parse_ob_line": {"tf": 1}}, "df": 1}}}}}}}, "n": {"docs": {"outrank": {"tf": 1.4142135623730951}, "outrank.core_ranking.prior_combinations_sample": {"tf": 1}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}}, "df": 6, "c": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 1}}, "df": 1}}, "l": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_ranking.prior_combinations_sample": {"tf": 1}}, "df": 1}}, "e": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1.4142135623730951}}, "df": 2, "s": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1}}}, "f": {"docs": {"outrank": {"tf": 1.4142135623730951}, "outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.core_ranking.prior_combinations_sample": {"tf": 1}, "outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1.7320508075688772}, "outrank.core_ranking.compute_coverage": {"tf": 1}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}, "outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.core_ranking.get_num_of_instances": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1.4142135623730951}, "outrank.core_utils.DatasetInformationStorage": {"tf": 1.4142135623730951}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 18}, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 1}}, "df": 1}, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1}}}}}}}, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}}, "df": 2}}}}}}}}, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}, "r": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_ranking.compute_combined_features": {"tf": 1}}, "df": 1}}}}, "b": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}}, "df": 4, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 1}}}}}}}}, "s": {"docs": {"outrank": {"tf": 1.7320508075688772}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.internal_hash": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 4, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {"outrank": {"tf": 1}}, "df": 1}}, "s": {"docs": {"outrank.task_generators.outrank_task_generate_data_set": {"tf": 1}}, "df": 1}}, "l": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.prior_combinations_sample": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1}}, "df": 2}}}}}}, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1, "d": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}}}}}}, "r": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.include_noisy_features": {"tf": 1}}, "df": 1}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.internal_hash": {"tf": 1}}, "df": 1}}}, "c": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 2.8284271247461903}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 2, "s": {"docs": {"outrank": {"tf": 1.4142135623730951}, "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}}, "df": 2}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}}, "df": 1}}}}, "p": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.get_combinations_from_columns": {"tf": 1}}, "df": 1}}}}, "h": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "w": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}}, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 1}}, "df": 1}}, "r": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank": {"tf": 1.4142135623730951}}, "df": 1}}}}, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.generic_line_parser": {"tf": 1}}, "df": 1}}}}}}, "y": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}}}, "u": {"docs": {}, "df": 0, "m": {"docs": {"outrank": {"tf": 1}}, "df": 1, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 1}}}}}}}}}}}, "b": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}}, "df": 1}}, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.prior_combinations_sample": {"tf": 1}}, "df": 1}}}}}}, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.prior_combinations_sample": {"tf": 1}, "outrank.core_utils.internal_hash": {"tf": 1}}, "df": 2}}, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}}}}}}, "k": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}}, "df": 2}}}}}, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}}, "df": 2}}}}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.checkpoint_importances_df": {"tf": 1}}, "df": 1}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.NumericFeatureSummary": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary": {"tf": 1}}, "df": 2}}}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.checkpoint_importances_df": {"tf": 1}}, "df": 1}, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.NumericFeatureSummary": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary": {"tf": 1}}, "df": 2}}}}}}}, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "d": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}}, "df": 1}}}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 2}}}}, "d": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1.4142135623730951}}, "df": 1, "d": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1.7320508075688772}}, "df": 1}}}}, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}}, "df": 2}}, "r": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.parse_ob_line_vw": {"tf": 1}}, "df": 1}}}}, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 1}}}}, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_ranking.include_noisy_features": {"tf": 1}}, "df": 1}}}}}}, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}}}}}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {"outrank": {"tf": 1.7320508075688772}, "outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1.7320508075688772}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.task_generators.outrank_task_generate_data_set": {"tf": 1}}, "df": 9, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.DatasetInformationStorage": {"tf": 1}}, "df": 1}}}}}}, "e": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank": {"tf": 1}}, "df": 1}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}}}}}}, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_ranking.get_combinations_from_columns": {"tf": 1}}, "df": 1}}}}}}}, "f": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}}, "df": 2}}}}}, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}}, "df": 1}}}}}}}}, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1}}}}}}, "t": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 2}}, "df": 1}}}}, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}}}, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.parse_ob_csv_line": {"tf": 1}}, "df": 1}}}}, "f": {"docs": {"outrank.core_utils.parse_ob_line_vw": {"tf": 1}}, "df": 1}, "i": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.generic_line_parser": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 2}}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}}, "df": 1}}}}}}}}}}}}}, "a": {"docs": {"outrank": {"tf": 3.1622776601683795}, "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1.7320508075688772}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}, "outrank.core_ranking.include_noisy_features": {"tf": 1}, "outrank.core_ranking.get_num_of_instances": {"tf": 1}, "outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.internal_hash": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage": {"tf": 1.4142135623730951}, "outrank.core_utils.NumericFeatureSummary": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary": {"tf": 1}, "outrank.core_utils.BatchRankingSummary": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1.4142135623730951}, "outrank.core_utils.generic_line_parser": {"tf": 1}, "outrank.core_utils.read_reference_json": {"tf": 1.4142135623730951}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}, "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 28, "l": {"docs": {}, "df": 0, "l": {"docs": {"outrank": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1}}, "df": 2}, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}, "s": {"docs": {}, "df": 0, "o": {"docs": {"outrank": {"tf": 1}}, "df": 1}}, "g": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "m": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}}, "df": 2, "s": {"docs": {"outrank": {"tf": 1.4142135623730951}}, "df": 1}}}}}}}}}, "s": {"docs": {"outrank": {"tf": 2.6457513110645907}, "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.core_ranking.include_noisy_features": {"tf": 1}}, "df": 3, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "t": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}, "n": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}}, "df": 2, "d": {"docs": {"outrank": {"tf": 1}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}}, "df": 3}, "y": {"docs": {"outrank": {"tf": 1}}, "df": 1}}, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 3}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "y": {"docs": {"outrank": {"tf": 2.23606797749979}, "outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1}}, "df": 2}}}, "g": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "t": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1}}}}}, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}}}, "c": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}}, "b": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}}, "df": 1}}}, "u": {"docs": {}, "df": 0, "x": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}}, "df": 1}}}}, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 1}}}}}}}}}, "m": {"docs": {}, "df": 0, "p": {"docs": {"outrank.core_ranking.get_combinations_from_columns": {"tf": 1}}, "df": 1}}, "|": {"docs": {}, "df": 0, "*": {"docs": {}, "df": 0, "|": {"docs": {}, "df": 0, "b": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1}}}}, "d": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.include_noisy_features": {"tf": 1}}, "df": 1}}, "p": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "x": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}}, "df": 1}}}}}}}}}}}}, "g": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_ranking.get_grouped_df": {"tf": 1}}, "df": 1}}}}}}}}}}, "f": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_ranking.get_grouped_df": {"tf": 1}}, "df": 1}}}}, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.generic_line_parser": {"tf": 1}}, "df": 1}}}}, "w": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.parse_namespace": {"tf": 1}}, "df": 1}}}}}}}}}, "f": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}}, "df": 1, "s": {"docs": {"outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 1, "/": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "s": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}, "l": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_ranking.mixed_rank_graph": {"tf": 1}}, "df": 1}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {"outrank": {"tf": 1.4142135623730951}, "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.core_ranking.get_num_of_instances": {"tf": 1}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1.7320508075688772}, "outrank.core_utils.internal_hash": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage": {"tf": 1}, "outrank.core_utils.read_reference_json": {"tf": 1}, "outrank.core_utils.parse_namespace": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}, "outrank.task_generators.outrank_task_generate_data_set": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 13, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1}}}}}, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "w": {"docs": {}, "df": 0, "s": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {"outrank": {"tf": 1.4142135623730951}, "outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1}, "outrank.core_ranking.get_num_of_instances": {"tf": 1}}, "df": 3}}, "l": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 1.7320508075688772}}, "df": 1}}}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 2.23606797749979}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1.7320508075688772}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 2}, "outrank.core_ranking.compute_subfeatures": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary": {"tf": 1}, "outrank.core_utils.parse_namespace": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 11, "a": {"docs": {"outrank": {"tf": 1.4142135623730951}}, "df": 1}, "b": {"docs": {"outrank": {"tf": 1}}, "df": 1}, "c": {"docs": {"outrank": {"tf": 1}}, "df": 1}, "s": {"docs": {"outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_ranking.compute_combined_features": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1.4142135623730951}, "outrank.core_ranking.include_noisy_features": {"tf": 1}, "outrank.core_ranking.compute_coverage": {"tf": 1}, "outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 8}}}}}}, "w": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}}, "df": 1}}, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {"outrank": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 2}, "outrank.core_utils.generic_line_parser": {"tf": 1}}, "df": 3}}}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"3": {"2": {"docs": {"outrank": {"tf": 1.7320508075688772}}, "df": 1}, "docs": {}, "df": 0}, "docs": {}, "df": 0}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1.4142135623730951}}, "df": 1}}, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.get_num_of_instances": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 2}}, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.parse_ob_csv_line": {"tf": 1}}, "df": 1}}}}}, "c": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}}, "df": 1, "a": {"docs": {}, "df": 0, "n": {"docs": {"outrank": {"tf": 2}, "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.core_utils.parse_ob_csv_line": {"tf": 1}}, "df": 3}, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 2, "s": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}}}}}, "l": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}}, "df": 1}}}}}}}, "r": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}}, "df": 1}, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.compute_cardinalities": {"tf": 1}}, "df": 1}}}}}}}}}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.task_generators.outrank_task_generate_data_set": {"tf": 1}}, "df": 4}, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_ranking.mixed_rank_graph": {"tf": 1}}, "df": 1}}}}}}}}}}}, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}}, "df": 1}}}}}, "e": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.compute_combined_features": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}, "outrank.core_ranking.compute_coverage": {"tf": 1}, "outrank.core_ranking.compute_cardinalities": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}}, "df": 8, "d": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}}, "df": 1}}}}}, "b": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.prior_combinations_sample": {"tf": 1}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}}, "df": 2}}}}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1}}}}}, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.parse_ob_csv_line": {"tf": 1}}, "df": 1}}}}, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}, "outrank.core_ranking.compute_value_counts": {"tf": 1}, "outrank.core_ranking.get_num_of_instances": {"tf": 1}}, "df": 4, "s": {"docs": {"outrank.core_ranking.prior_combinations_sample": {"tf": 1}}, "df": 1}}}}, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_ranking.enrich_with_transformations": {"tf": 1}}, "df": 1, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1.7320508075688772}}, "df": 1}}}}}}}}, "i": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1}}}}}}}}, "l": {"docs": {"outrank.core_utils.read_column_names": {"tf": 1}}, "df": 1, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_ranking.enrich_with_transformations": {"tf": 1}}, "df": 1}}}}}}}}, "v": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_coverage": {"tf": 1}}, "df": 1}}}}}}}, "y": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}, "l": {"docs": {}, "df": 0, "i": {"docs": {"outrank": {"tf": 1}}, "df": 1}, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.DatasetInformationStorage": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary": {"tf": 1}, "outrank.core_utils.BatchRankingSummary": {"tf": 1}}, "df": 4}}}, "u": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "s": {"docs": {"outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 1}}}}}}}, "s": {"docs": {}, "df": 0, "v": {"docs": {"outrank": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1.4142135623730951}}, "df": 2}}, "h": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}}, "df": 1}}}}, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "k": {"docs": {"outrank.core_ranking.include_noisy_features": {"tf": 1}}, "df": 1}}}}}, "b": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 2, "e": {"docs": {"outrank": {"tf": 2}, "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 3, "g": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}}, "df": 1}}}}}}, "a": {"docs": {}, "df": 0, "r": {"docs": {"outrank": {"tf": 1}}, "df": 1}, "t": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_ranking.compute_batch_ranking": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank": {"tf": 1}}, "df": 1}, "d": {"docs": {"outrank.core_utils.BatchRankingSummary": {"tf": 1}}, "df": 1}}}}}, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.prior_combinations_sample": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1}, "outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_ranking.compute_combined_features": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 10}}}}}, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "t": {"docs": {"outrank": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 2}}, "t": {"docs": {"outrank.core_utils.internal_hash": {"tf": 1}}, "df": 1}}, "o": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "k": {"docs": {"outrank": {"tf": 1}}, "df": 1}}, "w": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {"outrank": {"tf": 2}}, "df": 1}}}}, "g": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 2}}, "g": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_ranking.get_num_of_instances": {"tf": 1}}, "df": 1}}}}}, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_ranking.checkpoint_importances_df": {"tf": 1}}, "df": 1}}}}}, "i": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank": {"tf": 1.4142135623730951}}, "df": 1}}}}}, "t": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}}, "df": 1}}}}, "n": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}}, "df": 2, "s": {"docs": {"outrank.core_ranking.get_num_of_instances": {"tf": 1}}, "df": 1}}, "k": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {"outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 1}}}}}, "k": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}}, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 2}}}, "b": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_ranking.get_combinations_from_columns": {"tf": 1}}, "df": 1}}}}, "t": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1}}, "e": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}}, "df": 1, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank": {"tf": 1}, "outrank.core_ranking.get_grouped_df": {"tf": 1}}, "df": 2}}}}}, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "y": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies": {"tf": 1}}, "df": 1}}}}}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 2}}}}}, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_ranking.compute_batch_ranking": {"tf": 1}}, "df": 1}}}}}, "x": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}}, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 1.7320508075688772}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 2, "s": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 1}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"outrank": {"tf": 2}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 3}}, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}}, "df": 1}}}}}}}}}, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}}, "df": 2}}}}}}}, "f": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}}, "df": 2}}}}}}}}, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1.4142135623730951}}, "df": 2}}}, "v": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {"outrank": {"tf": 1.4142135623730951}, "outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.get_num_of_instances": {"tf": 1}}, "df": 6, "t": {"3": {"2": {"docs": {"outrank": {"tf": 2}}, "df": 1}, "docs": {}, "df": 0}, "docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank": {"tf": 1}, "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 4, "s": {"docs": {"outrank": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1}}, "df": 2}}}}}}}, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_ranking.checkpoint_importances_df": {"tf": 1}}, "df": 1}}}}}}}, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_utils.internal_hash": {"tf": 1}}, "df": 1}}}}, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}, "o": {"docs": {"outrank": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}}, "df": 2}}, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "t": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {"outrank": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}}, "c": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1, "l": {"docs": {}, "df": 0, "y": {"docs": {"outrank": {"tf": 1}, "outrank.core_ranking.compute_coverage": {"tf": 1}, "outrank.core_ranking.compute_cardinalities": {"tf": 1}}, "df": 3}}}}}}}}}}}, "f": {"docs": {}, "df": 0, "o": {"docs": {"outrank": {"tf": 2}}, "df": 1}}, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank": {"tf": 1.4142135623730951}}, "df": 1}}}, "v": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}}, "df": 1}}}}}}}, "e": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}}, "df": 1}}}}}}}}}, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}}}, "t": {"docs": {"outrank": {"tf": 1.7320508075688772}}, "df": 1, "s": {"docs": {"outrank": {"tf": 1}}, "df": 1}}, "s": {"docs": {"outrank": {"tf": 2}, "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.core_ranking.prior_combinations_sample": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1.4142135623730951}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 6}, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank": {"tf": 1}}, "df": 1}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}}, "df": 2}}}}}, "s": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 2}}}}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "t": {"docs": {"outrank": {"tf": 1}}, "df": 1, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.core_ranking.compute_batch_ranking": {"tf": 1}}, "df": 2}}}}}}}}}}, "f": {"docs": {"outrank": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}}, "df": 2}, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "y": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1}}, "df": 1}}}}}}}}, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}, "o": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}}}, "i": {"docs": {}, "df": 0, "p": {"docs": {"outrank": {"tf": 1}}, "df": 1}}, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1.4142135623730951}}, "df": 1}}}}}, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.parse_ob_line": {"tf": 1}}, "df": 1}}}, "e": {"docs": {"outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}, "outrank.core_utils.parse_namespace": {"tf": 1}}, "df": 3, "r": {"docs": {"outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}}, "df": 3}}}}, "i": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "w": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.mixed_rank_graph": {"tf": 1}}, "df": 1}}}}}}, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.parse_ob_line_vw": {"tf": 1}}, "df": 1}}}}}, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}, "outrank.core_utils.parse_ob_line_vw": {"tf": 1}}, "df": 3, "t": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}}, "df": 1}}, "t": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1}}}}}, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_ranking.prior_combinations_sample": {"tf": 1}}, "df": 1}}}, "o": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}}, "df": 1}}}}}}}}}}, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.get_num_of_instances": {"tf": 1}}, "df": 1}}}}}, "c": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 2}}}}}, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.internal_hash": {"tf": 1}}, "df": 1}}}}}}, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.DatasetInformationStorage": {"tf": 1}}, "df": 1}}}}}}}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {"outrank": {"tf": 1}}, "df": 1, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}}, "m": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}}}}}, "y": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank": {"tf": 1.4142135623730951}}, "df": 1}}}}}}, "g": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}}, "df": 1, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 1}}, "df": 1, "n": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 3}}}}, "o": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank": {"tf": 1}}, "df": 1}}, "v": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1}}}}}, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank": {"tf": 1.4142135623730951}, "outrank.core_utils.internal_hash": {"tf": 1}, "outrank.core_utils.DatasetInformationStorage": {"tf": 1}, "outrank.core_utils.NumericFeatureSummary": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary": {"tf": 1}, "outrank.core_utils.BatchRankingSummary": {"tf": 1}, "outrank.core_utils.parse_ob_line": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}, "outrank.core_utils.parse_ob_vw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_raw_feature_information": {"tf": 1}, "outrank.core_utils.parse_ob_feature_information": {"tf": 1}}, "df": 11}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}, "outrank.task_generators.outrank_task_generate_data_set": {"tf": 1}}, "df": 2}}}, "e": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}}, "df": 1}}}}}}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_ranking.mixed_rank_graph": {"tf": 1}}, "df": 1}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1}}}}}}}, "u": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 1.4142135623730951}}, "df": 1, "r": {"docs": {"outrank": {"tf": 1}}, "df": 1}, "d": {"docs": {"outrank": {"tf": 1}, "outrank.core_utils.internal_hash": {"tf": 1}}, "df": 2}, "f": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_ranking.get_num_of_instances": {"tf": 1}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1}}, "df": 2}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}}, "df": 3}}}}, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "q": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique": {"tf": 1}, "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 3}}}}}, "p": {"docs": {"outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}}, "df": 1, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_value_counts": {"tf": 1}}, "df": 1}}}}}}, "r": {"docs": {"outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "/": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}}}}}}, "f": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}, "q": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba": {"tf": 1}}, "df": 1}}}}}}, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_ranking.prior_combinations_sample": {"tf": 1}}, "df": 1}}}}}}, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_ranking.get_combinations_from_columns": {"tf": 1}}, "df": 1}}}}, "p": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.BatchRankingSummary": {"tf": 1}}, "df": 1}}}}}}}}}}, "s": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_utils.BatchRankingSummary": {"tf": 1}}, "df": 1}}}}}, "a": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_utils.read_column_names": {"tf": 1}}, "df": 1, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.read_reference_json": {"tf": 1}}, "df": 1}}}}}}, "a": {"docs": {}, "df": 0, "w": {"docs": {"outrank": {"tf": 1}}, "df": 1}, "n": {"docs": {}, "df": 0, "k": {"docs": {"outrank.core_ranking.mixed_rank_graph": {"tf": 1}}, "df": 1, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank": {"tf": 2.23606797749979}, "outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_utils.internal_hash": {"tf": 1}, "outrank.core_utils.BatchRankingSummary": {"tf": 1}}, "df": 4, "s": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {"outrank": {"tf": 1}}, "df": 1, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.include_noisy_features": {"tf": 1}}, "df": 1}}}}}}}}, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 1}}}, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1}}}}, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.checkpoint_importances_df": {"tf": 1}}, "df": 1}}}}, "m": {"docs": {}, "df": 0, "i": {"docs": {"outrank": {"tf": 1}}, "df": 1, "n": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}}, "df": 2, "i": {"docs": {"outrank": {"tf": 1}}, "df": 1, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank": {"tf": 1.7320508075688772}}, "df": 1}}}, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}}}}}}, "x": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"outrank.core_ranking.mixed_rank_graph": {"tf": 1}}, "df": 1}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 2}}, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}}, "df": 1}}}, "e": {"docs": {}, "df": 0, "l": {"docs": {"outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}}, "df": 1}}}}, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank": {"tf": 2}}, "df": 1}}}, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}}, "df": 1}}}}}}}}, "l": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "s": {"docs": {"outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}}, "df": 1}}}}, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}}, "df": 1}}}}}}}}, "c": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}}, "df": 1}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {"outrank": {"tf": 2}}, "df": 1}}, "a": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_ranking.get_grouped_df": {"tf": 1}}, "df": 1}}}}, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {"outrank.algorithms.importance_estimator.get_importances_estimate_pairwise": {"tf": 1}, "outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.core_utils.generic_line_parser": {"tf": 1}, "outrank.core_utils.read_reference_json": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}, "outrank.task_generators.outrank_task_generate_data_set": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 8}}}}, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}, "outrank.algorithms.sketches.counting_ultiloglog": {"tf": 1}}, "df": 3}}}}, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 1}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}}}}}, "a": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.prior_combinations_sample": {"tf": 1}}, "df": 1}}, "p": {"docs": {}, "df": 0, "s": {"docs": {"outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 1}}}}, "y": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "p": {"docs": {"outrank": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_ranking.get_grouped_df": {"tf": 1}, "outrank.core_ranking.checkpoint_importances_df": {"tf": 1}, "outrank.core_utils.read_reference_json": {"tf": 1}}, "df": 3}}}}, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank.core_ranking.get_combinations_from_columns": {"tf": 1}, "outrank.core_ranking.mixed_rank_graph": {"tf": 1}}, "df": 2}}}}}}}, "r": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.internal_hash": {"tf": 1}}, "df": 1}}, "a": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_utils.read_column_names": {"tf": 1}}, "df": 1}}}}}, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "h": {"docs": {"outrank": {"tf": 2}}, "df": 1, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_ranking.compute_combined_features": {"tf": 1}}, "df": 1}}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}}, "df": 1}}}}}}}}}}}, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_utils.internal_hash": {"tf": 1}}, "df": 1, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}}, "df": 2}}}}}, "p": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}}}, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}}}}}, "r": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.internal_hash": {"tf": 1}}, "df": 1}}}}}}, "v": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.parse_ob_csv_line": {"tf": 1}}, "df": 1}}}, "o": {"docs": {}, "df": 0, "t": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 2}, "w": {"docs": {"outrank.core_ranking.compute_feature_memory_consumption": {"tf": 1}}, "df": 1}, "l": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"outrank.core_utils.DatasetInformationStorage": {"tf": 1}}, "df": 1}}}}}}}, "n": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "a": {"docs": {"outrank": {"tf": 2.23606797749979}, "outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}}, "df": 3}, "e": {"docs": {}, "df": 0, "r": {"docs": {"outrank.core_ranking.get_num_of_instances": {"tf": 1}}, "df": 1}}}, "p": {"docs": {}, "df": 0, "y": {"docs": {"outrank": {"tf": 1}}, "df": 1}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"outrank.core_utils.NumericFeatureSummary": {"tf": 1}, "outrank.core_utils.NominalFeatureSummary": {"tf": 1}}, "df": 2}}}}}}, "p": {"docs": {"outrank": {"tf": 3.872983346207417}}, "df": 1}, "e": {"docs": {}, "df": 0, "w": {"docs": {"outrank.core_ranking.enrich_with_transformations": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}}, "df": 2}, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "s": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "y": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}}}}}}, "t": {"docs": {"outrank.core_ranking.estimate_importances_minibatches": {"tf": 1}}, "df": 1}, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features": {"tf": 1}}, "df": 1}}}}, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_utils.parse_ob_line_vw": {"tf": 1}, "outrank.core_utils.parse_namespace": {"tf": 1}}, "df": 2}}}}}}}}}, "v": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "s": {"docs": {"outrank": {"tf": 1}}, "df": 1}}}}}}, "i": {"docs": {}, "df": 0, "a": {"docs": {"outrank.core_ranking.compute_combined_features": {"tf": 1}}, "df": 1}, "s": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters": {"tf": 1}, "outrank.visualizations.ranking_visualization.visualize_all": {"tf": 1}}, "df": 2}}}}}}}}}}}}, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1.4142135623730951}, "outrank.core_ranking.compute_subfeatures": {"tf": 1.4142135623730951}}, "df": 2, "s": {"docs": {"outrank.core_ranking.compute_expanded_multivalue_features": {"tf": 1}, "outrank.core_ranking.compute_subfeatures": {"tf": 1}, "outrank.core_utils.summarize_rare_counts": {"tf": 1}}, "df": 3}}}}}, "w": {"docs": {"outrank.core_utils.parse_ob_line_vw": {"tf": 1}}, "df": 1}}, "j": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {"outrank.algorithms.sketches.counting_cms.CountMinSketch": {"tf": 1}, "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter": {"tf": 1}}, "df": 2}}, "s": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"outrank.core_utils.parse_ob_csv_line": {"tf": 1}, "outrank.core_utils.read_reference_json": {"tf": 1}, "outrank.core_utils.extract_features_from_reference_JSON": {"tf": 1}, "outrank.core_utils.summarize_feature_bounds_for_transformers": {"tf": 1}}, "df": 4}}}}, "x": {"docs": {}, "df": 0, "x": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "h": {"docs": {"outrank.core_ranking.compute_combined_features": {"tf": 1}}, "df": 1}}}}}}}}}, "pipeline": ["trimmer"], "_isPrebuiltIndex": true};
+    /** pdoc search index */const docs = [{"fullname": "outrank", "modulename": "outrank", "kind": "module", "doc": "<h1 id=\"welcome-to-outranks-documentation\">Welcome to OutRank's documentation!</h1>\n\n<p>All functions/methods can be searched-for (search bar on the left).</p>\n\n<p>This tool enables fast screening of feature-feature interactions. Its purpose is to give the user fast insight into potential redundancies/anomalies in the data.\nIt is implemented to operate in _mini batches_, it traverses the <code>raw data</code> incrementally, refining the rankings as it goes along. The core operation, interaction ranking, outputs triplets which look as follows:</p>\n\n<pre><code>featureA    featureB    0.512\nfeatureA    featureC    0.125\n</code></pre>\n\n<h1 id=\"setup\">Setup</h1>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code>pip<span class=\"w\"> </span>install<span class=\"w\"> </span>outrank\n</code></pre>\n</div>\n\n<p>and test a minimal cycle with</p>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code>outrank<span class=\"w\"> </span>--task<span class=\"w\"> </span>selftest\n</code></pre>\n</div>\n\n<p>if this passes, you can be pretty certain OutRank will perform as intended. OutRank's primary use case is as a CLI tool, begin exploring with</p>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code>outrank<span class=\"w\"> </span>--help\n</code></pre>\n</div>\n\n<h1 id=\"example-use-cases\">Example use cases</h1>\n\n<ul>\n<li><p>A minimal showcase of performing feature ranking on a generic CSV is demonstrated with <a href=\"https://github.com/outbrain/outrank/tree/main/scripts/run_minimal.sh\">this example</a>.</p></li>\n<li><p><a href=\"https://github.com/outbrain/outrank/tree/main/examples\">More examples</a> demonstrating OutRank's capabilities are also available.</p></li>\n</ul>\n\n<h1 id=\"outrank-as-a-python-library\">OutRank as a Python library</h1>\n\n<p>Once installed, _OutRank_ can be used as any other Python library. For example, generic feature ranking algorithms can be accessed as</p>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"kn\">from</span> <span class=\"nn\">outrank.algorithms.feature_ranking.ranking_mi_numba</span> <span class=\"kn\">import</span> <span class=\"p\">(</span>\n    <span class=\"n\">mutual_info_estimator_numba</span><span class=\"p\">,</span>\n<span class=\"p\">)</span>\n\n<span class=\"c1\"># Some synthetic minimal data (Numpy vectors)</span>\n<span class=\"n\">a</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">([</span><span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">],</span> <span class=\"n\">dtype</span><span class=\"o\">=</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">int32</span><span class=\"p\">)</span>\n\n<span class=\"n\">lowest</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">(</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">random</span><span class=\"o\">.</span><span class=\"n\">permutation</span><span class=\"p\">(</span><span class=\"n\">a</span><span class=\"p\">),</span> <span class=\"n\">dtype</span><span class=\"o\">=</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">int32</span><span class=\"p\">)</span>\n<span class=\"n\">medium</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">([</span><span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">],</span> <span class=\"n\">dtype</span><span class=\"o\">=</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">int32</span><span class=\"p\">)</span>\n<span class=\"n\">high</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">([</span><span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">],</span> <span class=\"n\">dtype</span><span class=\"o\">=</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">int32</span><span class=\"p\">)</span>\n\n<span class=\"n\">lowest_score</span> <span class=\"o\">=</span> <span class=\"n\">mutual_info_estimator_numba</span><span class=\"p\">(</span>\n    <span class=\"n\">a</span><span class=\"p\">,</span> <span class=\"n\">lowest</span><span class=\"p\">,</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">float32</span><span class=\"p\">(</span><span class=\"mf\">1.0</span><span class=\"p\">),</span> <span class=\"kc\">False</span><span class=\"p\">,</span>\n<span class=\"p\">)</span>\n<span class=\"n\">medium_score</span> <span class=\"o\">=</span> <span class=\"n\">mutual_info_estimator_numba</span><span class=\"p\">(</span>\n    <span class=\"n\">a</span><span class=\"p\">,</span> <span class=\"n\">medium</span><span class=\"p\">,</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">float32</span><span class=\"p\">(</span><span class=\"mf\">1.0</span><span class=\"p\">),</span> <span class=\"kc\">False</span><span class=\"p\">,</span>\n<span class=\"p\">)</span>\n<span class=\"n\">high_score</span> <span class=\"o\">=</span> <span class=\"n\">mutual_info_estimator_numba</span><span class=\"p\">(</span>\n    <span class=\"n\">a</span><span class=\"p\">,</span> <span class=\"n\">high</span><span class=\"p\">,</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">float32</span><span class=\"p\">(</span><span class=\"mf\">1.0</span><span class=\"p\">),</span> <span class=\"kc\">False</span><span class=\"p\">,</span>\n<span class=\"p\">)</span>\n\n<span class=\"n\">scores</span> <span class=\"o\">=</span> <span class=\"p\">[</span><span class=\"n\">lowest_score</span><span class=\"p\">,</span> <span class=\"n\">medium_score</span><span class=\"p\">,</span> <span class=\"n\">high_score</span><span class=\"p\">]</span>\n<span class=\"n\">sorted_score_indices</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">argsort</span><span class=\"p\">(</span><span class=\"n\">scores</span><span class=\"p\">)</span>\n<span class=\"k\">assert</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">sum</span><span class=\"p\">(</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">([</span><span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">2</span><span class=\"p\">])</span> <span class=\"o\">-</span> <span class=\"n\">sorted_score_indices</span><span class=\"p\">)</span> <span class=\"o\">==</span>  <span class=\"mi\">0</span>\n</code></pre>\n</div>\n\n<hr />\n\n<h2 id=\"creating-a-simple-dataset\">Creating a simple dataset</h2>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"kn\">from</span> <span class=\"nn\">outrank.algorithms.synthetic_data_generators.cc_generator</span> <span class=\"kn\">import</span> <span class=\"n\">CategoricalClassification</span>\n\n<span class=\"n\">cc</span> <span class=\"o\">=</span> <span class=\"n\">CategoricalClassification</span><span class=\"p\">()</span>\n\n<span class=\"c1\"># Creates a simple dataset of 10 features, 10k samples, with feature cardinality of all features being 35</span>\n<span class=\"n\">X</span> <span class=\"o\">=</span> <span class=\"n\">cc</span><span class=\"o\">.</span><span class=\"n\">generate_data</span><span class=\"p\">(</span><span class=\"mi\">9</span><span class=\"p\">,</span> \n                     <span class=\"mi\">10000</span><span class=\"p\">,</span> \n                     <span class=\"n\">cardinality</span><span class=\"o\">=</span><span class=\"mi\">35</span><span class=\"p\">,</span> \n                     <span class=\"n\">ensure_rep</span><span class=\"o\">=</span><span class=\"kc\">True</span><span class=\"p\">,</span> \n                     <span class=\"n\">random_values</span><span class=\"o\">=</span><span class=\"kc\">True</span><span class=\"p\">,</span> \n                     <span class=\"n\">low</span><span class=\"o\">=</span><span class=\"mi\">0</span><span class=\"p\">,</span> \n                     <span class=\"n\">high</span><span class=\"o\">=</span><span class=\"mi\">40</span><span class=\"p\">)</span>\n\n<span class=\"c1\"># Creates target labels via clustering</span>\n<span class=\"n\">y</span> <span class=\"o\">=</span> <span class=\"n\">cc</span><span class=\"o\">.</span><span class=\"n\">generate_labels</span><span class=\"p\">(</span><span class=\"n\">X</span><span class=\"p\">,</span> <span class=\"n\">n</span><span class=\"o\">=</span><span class=\"mi\">2</span><span class=\"p\">,</span> <span class=\"n\">class_relation</span><span class=\"o\">=</span><span class=\"s1\">&#39;cluster&#39;</span><span class=\"p\">)</span>\n</code></pre>\n</div>\n"}, {"fullname": "outrank.algorithms", "modulename": "outrank.algorithms", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.feature_ranking", "modulename": "outrank.algorithms.feature_ranking", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "numba_unique", "kind": "function", "doc": "<p>Identify unique elements in an array, fast</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">a</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "compute_conditional_entropy", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">Y_classes</span>,</span><span class=\"param\">\t<span class=\"n\">class_values</span>,</span><span class=\"param\">\t<span class=\"n\">class_var_shape</span>,</span><span class=\"param\">\t<span class=\"n\">initial_prob</span>,</span><span class=\"param\">\t<span class=\"n\">nonzero_counts</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "compute_entropies", "kind": "function", "doc": "<p>Core entropy computation function</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">X</span>, </span><span class=\"param\"><span class=\"n\">Y</span>, </span><span class=\"param\"><span class=\"n\">all_events</span>, </span><span class=\"param\"><span class=\"n\">f_values</span>, </span><span class=\"param\"><span class=\"n\">f_value_counts</span>, </span><span class=\"param\"><span class=\"n\">cardinality_correction</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "stratified_subsampling", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">Y</span>, </span><span class=\"param\"><span class=\"n\">X</span>, </span><span class=\"param\"><span class=\"n\">approximation_factor</span>, </span><span class=\"param\"><span class=\"n\">_f_values_X</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "mutual_info_estimator_numba", "kind": "function", "doc": "<p>Core estimator logic. Compute unique elements, subset if required</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">Y</span>, </span><span class=\"param\"><span class=\"n\">X</span>, </span><span class=\"param\"><span class=\"n\">approximation_factor</span><span class=\"o\">=</span><span class=\"mf\">1.0</span>, </span><span class=\"param\"><span class=\"n\">cardinality_correction</span><span class=\"o\">=</span><span class=\"kc\">False</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator", "modulename": "outrank.algorithms.importance_estimator", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.importance_estimator.logger", "modulename": "outrank.algorithms.importance_estimator", "qualname": "logger", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;Logger syn-logger (DEBUG)&gt;"}, {"fullname": "outrank.algorithms.importance_estimator.num_folds", "modulename": "outrank.algorithms.importance_estimator", "qualname": "num_folds", "kind": "variable", "doc": "<p></p>\n", "default_value": "4"}, {"fullname": "outrank.algorithms.importance_estimator.sklearn_MI", "modulename": "outrank.algorithms.importance_estimator", "qualname": "sklearn_MI", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">vector_first</span><span class=\"p\">:</span> <span class=\"n\">Any</span>, </span><span class=\"param\"><span class=\"n\">vector_second</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">float</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.sklearn_surrogate", "modulename": "outrank.algorithms.importance_estimator", "qualname": "sklearn_surrogate", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">vector_first</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">vector_second</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">surrogate_model</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">float</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.numba_mi", "modulename": "outrank.algorithms.importance_estimator", "qualname": "numba_mi", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">vector_first</span>, </span><span class=\"param\"><span class=\"n\">vector_second</span>, </span><span class=\"param\"><span class=\"n\">heuristic</span>, </span><span class=\"param\"><span class=\"n\">mi_stratified_sampling_ratio</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.sklearn_mi_adj", "modulename": "outrank.algorithms.importance_estimator", "qualname": "sklearn_mi_adj", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">vector_first</span>, </span><span class=\"param\"><span class=\"n\">vector_second</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise", "modulename": "outrank.algorithms.importance_estimator", "qualname": "get_importances_estimate_pairwise", "kind": "function", "doc": "<p>A method for parallel importances estimation. As interaction scoring is independent, individual scores can be computed in parallel.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">combination</span>, </span><span class=\"param\"><span class=\"n\">reference_model_features</span>, </span><span class=\"param\"><span class=\"n\">args</span>, </span><span class=\"param\"><span class=\"n\">tmp_df</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.rank_features_3MR", "modulename": "outrank.algorithms.importance_estimator", "qualname": "rank_features_3MR", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">relevance_dict</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">redundancy_dict</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">relational_dict</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">strategy</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;median&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">alpha</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mi\">1</span>,</span><span class=\"param\">\t<span class=\"n\">beta</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mi\">1</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic", "modulename": "outrank.algorithms.importance_estimator", "qualname": "get_importances_estimate_nonmyopic", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>, </span><span class=\"param\"><span class=\"n\">tmp_df</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.initialize_classifier", "modulename": "outrank.algorithms.importance_estimator", "qualname": "initialize_classifier", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">surrogate_model</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches", "modulename": "outrank.algorithms.sketches", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms", "modulename": "outrank.algorithms.sketches.counting_cms", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.cms_hash", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "cms_hash", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">x</span>, </span><span class=\"param\"><span class=\"n\">seed</span>, </span><span class=\"param\"><span class=\"n\">width</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch", "kind": "class", "doc": "<p>A memory-efficient implementation of the count min sketch algorithm with optimized hashing using Numba JIT.</p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">depth</span><span class=\"o\">=</span><span class=\"mi\">6</span>, </span><span class=\"param\"><span class=\"n\">width</span><span class=\"o\">=</span><span class=\"mi\">32768</span>, </span><span class=\"param\"><span class=\"n\">M</span><span class=\"o\">=</span><span class=\"kc\">None</span></span>)</span>"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.depth", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.depth", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.width", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.width", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.hash_seeds", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.M", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.M", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.add", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">x</span>, </span><span class=\"param\"><span class=\"n\">delta</span><span class=\"o\">=</span><span class=\"mi\">1</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.batch_add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">lst</span>, </span><span class=\"param\"><span class=\"n\">delta</span><span class=\"o\">=</span><span class=\"mi\">1</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.query", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.query", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">x</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.get_matrix", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter", "kind": "class", "doc": "<p>A memory-efficient implementation of the count min sketch algorithm with optimized hashing using Numba JIT.</p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">bound</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">30000</span></span>)</span>"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.max_bound_thr", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.default_counter", "kind": "variable", "doc": "<p></p>\n", "annotation": ": collections.Counter"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.batch_add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">lst</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">val</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "kind": "module", "doc": "<p>This module implements probabilistic data structure which is able to calculate the cardinality of large multisets in a single pass using little auxiliary memory</p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache", "kind": "class", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">error_rate</span><span class=\"o\">=</span><span class=\"mf\">0.005</span></span>)</span>"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.p", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.p", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.m", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.m", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.warmup_set", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.warmup_size", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.width", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.width", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.hll_flag", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">value</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators", "modulename": "outrank.algorithms.synthetic_data_generators", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification", "kind": "class", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.dataset_info", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.dataset_info", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_data", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_data", "kind": "function", "doc": "<p>Generates dataset based on given parameters</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>n_features</strong>:  number of generated features</li>\n<li><strong>n_samples</strong>:  number of generated samples</li>\n<li><strong>cardinality</strong>:  default cardinality of the dataset</li>\n<li><strong>structure</strong>:  structure of the dataset</li>\n<li><strong>ensure_rep</strong>:  flag, ensures all given values represented</li>\n<li><strong>random_values</strong>:  flag, enables random (integer) feature values from set [low, high]</li>\n<li><strong>low</strong>:  sets lower bound of random feature values</li>\n<li><strong>high</strong>:  sets high bound of random feature values</li>\n<li><strong>seed</strong>:  sets seed of numpy random</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>X, 2D dataset</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">n_features</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">n_samples</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">cardinality</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">5</span>,</span><span class=\"param\">\t<span class=\"n\">structure</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]],</span> <span class=\"n\">NoneType</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">ensure_rep</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">random_values</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">low</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"mi\">0</span>,</span><span class=\"param\">\t<span class=\"n\">high</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"mi\">1000</span>,</span><span class=\"param\">\t<span class=\"n\">seed</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">42</span></span><span class=\"return-annotation\">) -> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_combinations", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_combinations", "kind": "function", "doc": "<p>Generates linear, nonlinear, or custom combinations within feature vectors in given dataset X</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset</li>\n<li><strong>feature_indices</strong>:  indexes of features to be in combination</li>\n<li><strong>combination_function</strong>:  optional custom function for combining feature vectors</li>\n<li><strong>combination_type</strong>:  string flag, either liner or nonlinear, defining combination type</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>X with added resultant feature</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">feature_indices</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">combination_function</span><span class=\"p\">:</span> <span class=\"n\">Optional</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">combination_type</span><span class=\"p\">:</span> <span class=\"n\">Literal</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;linear&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_correlated", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_correlated", "kind": "function", "doc": "<p>Generates correlated features using the given feature indices. Correlation is based on cosine of angle between vectors with mean 0.</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset</li>\n<li><strong>feature_indices</strong>:  indices of features to generate correlated feature to</li>\n<li><strong>r</strong>:  (Pearson) correlation factor</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>X with generated correlated  features</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">feature_indices</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">r</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">0.8</span></span><span class=\"return-annotation\">) -> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_duplicates", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_duplicates", "kind": "function", "doc": "<p>Generates duplicate features</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset</li>\n<li><strong>feature_indices</strong>:  indices of features to duplicate</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>dataset with duplicated features</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">feature_indices</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_labels", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_labels", "kind": "function", "doc": "<p>Generates labels for dataset X</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset</li>\n<li><strong>n</strong>:  number of class labels</li>\n<li><strong>p</strong>:  class distribution</li>\n<li><strong>k</strong>:  constant</li>\n<li><strong>decision_function</strong>:  optional user-defined decision function</li>\n<li><strong>class_relation</strong>:  string, either 'linear', 'nonlinear', or 'cluster'</li>\n<li><strong>balance</strong>:  boolean, whether to balance clustering class labels</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>array of labels, corresponding to dataset X</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">n</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">2</span>,</span><span class=\"param\">\t<span class=\"n\">p</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">float</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span> <span class=\"o\">=</span> <span class=\"mf\">0.5</span>,</span><span class=\"param\">\t<span class=\"n\">k</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">|</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mi\">2</span>,</span><span class=\"param\">\t<span class=\"n\">decision_function</span><span class=\"p\">:</span> <span class=\"n\">Optional</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">class_relation</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;linear&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">balance</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_noise", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_noise", "kind": "function", "doc": "<p>Simulates noise on given dataset X</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset to apply noise to</li>\n<li><strong>y</strong>:  required target labels for categorical noise generation</li>\n<li><strong>p</strong>:  amount of noise to apply. Defaults to 0.2</li>\n<li><strong>type</strong>:  type of noise to apply, either categorical or missing</li>\n<li><strong>missing_val</strong>:  value to simulate missing values. Defaults to float('-inf')</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>X with noise applied</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">y</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">p</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">0.2</span>,</span><span class=\"param\">\t<span class=\"nb\">type</span><span class=\"p\">:</span> <span class=\"n\">Literal</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;categorical&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">missing_val</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">|</span> <span class=\"nb\">int</span> <span class=\"o\">|</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"o\">-</span><span class=\"n\">inf</span></span><span class=\"return-annotation\">) -> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.downsample_dataset", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.downsample_dataset", "kind": "function", "doc": "<p>Downsamples dataset X according to N or the number of samples in minority class, resulting in a balanced dataset.</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  Dataset to downsample</li>\n<li><strong>y</strong>:  Labels corresponding to X</li>\n<li><strong>N</strong>:  Optional number of samples per class to downsample to</li>\n<li><strong>seed</strong>:  Seed for random state of resample function</li>\n<li><strong>reshuffle</strong>:  Reshuffle the dataset after downsampling</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>Balanced X and y after downsampling</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">y</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">N</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">seed</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">42</span>,</span><span class=\"param\">\t<span class=\"n\">reshuffle</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.print_dataset", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.print_dataset", "kind": "function", "doc": "<p>Prints given dataset</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset</li>\n<li><strong>y</strong>:  labels</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">y</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.summarize", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.summarize", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.generator_naive", "modulename": "outrank.algorithms.synthetic_data_generators.generator_naive", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix", "modulename": "outrank.algorithms.synthetic_data_generators.generator_naive", "qualname": "generate_random_matrix", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">num_features</span><span class=\"o\">=</span><span class=\"mi\">100</span>, </span><span class=\"param\"><span class=\"n\">size</span><span class=\"o\">=</span><span class=\"mi\">20000</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking", "modulename": "outrank.core_ranking", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.core_ranking.logger", "modulename": "outrank.core_ranking", "qualname": "logger", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;Logger syn-logger (DEBUG)&gt;"}, {"fullname": "outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE", "modulename": "outrank.core_ranking", "qualname": "GLOBAL_CARDINALITY_STORAGE", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[typing.Any, typing.Any]", "default_value": "{}"}, {"fullname": "outrank.core_ranking.GLOBAL_COUNTS_STORAGE", "modulename": "outrank.core_ranking", "qualname": "GLOBAL_COUNTS_STORAGE", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[typing.Any, typing.Any]", "default_value": "{}"}, {"fullname": "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE", "modulename": "outrank.core_ranking", "qualname": "GLOBAL_RARE_VALUE_STORAGE", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[str, typing.Any]", "default_value": "Counter()"}, {"fullname": "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS", "modulename": "outrank.core_ranking", "qualname": "GLOBAL_PRIOR_COMB_COUNTS", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[typing.Any, int]", "default_value": "Counter()"}, {"fullname": "outrank.core_ranking.IGNORED_VALUES", "modulename": "outrank.core_ranking", "qualname": "IGNORED_VALUES", "kind": "variable", "doc": "<p></p>\n", "default_value": "set()"}, {"fullname": "outrank.core_ranking.HYPERLL_ERROR_BOUND", "modulename": "outrank.core_ranking", "qualname": "HYPERLL_ERROR_BOUND", "kind": "variable", "doc": "<p></p>\n", "default_value": "0.02"}, {"fullname": "outrank.core_ranking.MAX_FEATURES_3MR", "modulename": "outrank.core_ranking", "qualname": "MAX_FEATURES_3MR", "kind": "variable", "doc": "<p></p>\n", "default_value": "10000"}, {"fullname": "outrank.core_ranking.prior_combinations_sample", "modulename": "outrank.core_ranking", "qualname": "prior_combinations_sample", "kind": "function", "doc": "<p>Make sure only relevant subspace of combinations is selected based on prior counts</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">combinations</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.get_combinations_from_columns", "modulename": "outrank.core_ranking", "qualname": "get_combinations_from_columns", "kind": "function", "doc": "<p>Return feature-feature &amp; feature-label combinations, depending on the heuristic and ranking scope</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">all_columns</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">indexes</span><span class=\"o\">.</span><span class=\"n\">base</span><span class=\"o\">.</span><span class=\"n\">Index</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.mixed_rank_graph", "modulename": "outrank.core_ranking", "qualname": "mixed_rank_graph", "kind": "function", "doc": "<p>Compute the full mixed rank graph corresponding to all pairwise feature interactions based on the selected heuristic</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">cpu_pool</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">BatchRankingSummary</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.enrich_with_transformations", "modulename": "outrank.core_ranking", "qualname": "enrich_with_transformations", "kind": "function", "doc": "<p>Construct a collection of new features based on pre-defined transformations/rules</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">num_col_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_combined_features", "modulename": "outrank.core_ranking", "qualname": "compute_combined_features", "kind": "function", "doc": "<p>Compute higher order features via xxhash-based trick.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">is_3mr</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_expanded_multivalue_features", "modulename": "outrank.core_ranking", "qualname": "compute_expanded_multivalue_features", "kind": "function", "doc": "<p>Compute one-hot encoded feature space based on each designated multivalue feature. E.g., feature with value \"a,b,c\" becomes three features, values of which are presence of a given value in a mutlivalue feature of choice.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_subfeatures", "modulename": "outrank.core_ranking", "qualname": "compute_subfeatures", "kind": "function", "doc": "<p>Compute derived features that are more fine-grained. Implements logic around two operators that govern feature construction.\n->: One sided construction - every value from left side is fine, separate ones from the right side feature will be considered.\n&lt;->: Two sided construction - two-sided values present. This means that each value from a is combined with each from b, forming |A|*|B| new features (one-hot encoded)</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.include_noisy_features", "modulename": "outrank.core_ranking", "qualname": "include_noisy_features", "kind": "function", "doc": "<p>Add randomized features that serve as a sanity check</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_coverage", "modulename": "outrank.core_ranking", "qualname": "compute_coverage", "kind": "function", "doc": "<p>Compute coverage of features, incrementally</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_feature_memory_consumption", "modulename": "outrank.core_ranking", "qualname": "compute_feature_memory_consumption", "kind": "function", "doc": "<p>An approximation of how much feature take up</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_value_counts", "modulename": "outrank.core_ranking", "qualname": "compute_value_counts", "kind": "function", "doc": "<p>Update the count structure</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>, </span><span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_cardinalities", "modulename": "outrank.core_ranking", "qualname": "compute_cardinalities", "kind": "function", "doc": "<p>Compute cardinalities of features, incrementally</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">max_unique_hist_constraint</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_bounds_increment", "modulename": "outrank.core_ranking", "qualname": "compute_bounds_increment", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">numeric_column_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_batch_ranking", "modulename": "outrank.core_ranking", "qualname": "compute_batch_ranking", "kind": "function", "doc": "<p>Enrich the feature space and compute the batch importances</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">line_tmp_storage</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">numeric_column_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">cpu_pool</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">column_descriptions</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">BatchRankingSummary</span><span class=\"p\">,</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.get_grouped_df", "modulename": "outrank.core_ranking", "qualname": "get_grouped_df", "kind": "function", "doc": "<p>A helper method that enables median-based aggregation after processing</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">importances_df_list</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.checkpoint_importances_df", "modulename": "outrank.core_ranking", "qualname": "checkpoint_importances_df", "kind": "function", "doc": "<p>A helper which stores intermediary state - useful for longer runs</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">importances_batch</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.estimate_importances_minibatches", "modulename": "outrank.core_ranking", "qualname": "estimate_importances_minibatches", "kind": "function", "doc": "<p>Interaction score estimator - suitable for example for csv-like input data types.\nThis type of data is normally a single large csv, meaning that minibatch processing needs to\nhappen during incremental handling of the file (that\"s not the case for pre-separated ob data)</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_file</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">column_descriptions</span><span class=\"p\">:</span> <span class=\"nb\">list</span>,</span><span class=\"param\">\t<span class=\"n\">fw_col_mapping</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">numeric_column_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span>,</span><span class=\"param\">\t<span class=\"n\">batch_size</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">100000</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">data_encoding</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;utf-8&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">cpu_pool</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;</span><span class=\"se\">\\t</span><span class=\"s1\">&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">feature_construction_mode</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">defaultdict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_selftest", "modulename": "outrank.core_selftest", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.core_utils", "modulename": "outrank.core_utils", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.core_utils.pro_tips", "modulename": "outrank.core_utils", "qualname": "pro_tips", "kind": "variable", "doc": "<p></p>\n", "default_value": "[&#x27;OutRank can construct subfeatures; features based on subspaces. Example command argument is: --subfeature_mapping &quot;feature_a-&gt;feature_b;feature_c&lt;-&gt;feature_d;feature_c&lt;-&gt;feature_e&quot;&#x27;, &#x27;Heuristic MI-numba-randomized seems like the best of both worlds! (speed + performance).&#x27;, &#x27;Heuristic surrogate-lr performs cross-validation (internally), keep that in mind!&#x27;, &#x27;Consider running OutRank on a smaller data sample first, might be enough (--subsampling = a lot).&#x27;, &#x27;There are two types of combinations supported; unsupervised pairwise ranking (redundancies- --target_ranking_only=False), and supervised combinations - (--interaction_order &gt; 1)&#x27;, &#x27;Visualization part also includes clustering - this might be very insightful!&#x27;, &#x27;By default OutRank includes feature cardinality and coverage in feature names (card; cov)&#x27;, &#x27;Intermediary checkpoints (tmp_checkpoint.tsv) might already give you insights during longer runs.&#x27;, &#x27;In theory, you can rank redundancies of combined features (--interaction_order AND --target_ranking_only=False).&#x27;, &#x27;Give it as many threads as physically possible (--num_threads).&#x27;, &#x27;You can speed up ranking by diminishing feature buffer size (--combination_number_upper_bound determines how many ranking computations per batch will be considered). This, and --subsampling are very powerful together.&#x27;, &#x27;Want to rank feature transformations, but not sure which ones to choose? --transformers=default should serve as a solid baseline (common DS transformations included).&#x27;, &#x27;Your target can be any feature! (explaining one feature with others)&#x27;, &#x27;OutRank uses HyperLogLog for cardinality estimation - this is also a potential usecase (understanding cardinalities across different data sets).&#x27;, &#x27;Each feature is named as featureName(cardinality, coverage in percents) in the final files.&#x27;, &#x27;You can generate candidate feature transformation ranges (fw) by using --task=feature_summary_transformers.&#x27;]"}, {"fullname": "outrank.core_utils.write_json_dump_to_file", "modulename": "outrank.core_utils", "qualname": "write_json_dump_to_file", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>, </span><span class=\"param\"><span class=\"n\">config_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.internal_hash", "modulename": "outrank.core_utils", "qualname": "internal_hash", "kind": "function", "doc": "<p>A generic internal hash used throughout ranking procedure - let's hardcode seed here for sure</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_obj</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.DatasetInformationStorage", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage", "kind": "class", "doc": "<p>A generic class for holding properties of a given type of dataset</p>\n"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.__init__", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">data_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">column_names</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">column_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">col_delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">|</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">encoding</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">fw_map</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">|</span> <span class=\"kc\">None</span></span>)</span>"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.data_path", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.data_path", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.column_names", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.column_names", "kind": "variable", "doc": "<p></p>\n", "annotation": ": list[str]"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.column_types", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.column_types", "kind": "variable", "doc": "<p></p>\n", "annotation": ": set[str]"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.col_delimiter", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.col_delimiter", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str | None"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.encoding", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.encoding", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.fw_map", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.fw_map", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[str, str] | None"}, {"fullname": "outrank.core_utils.NumericFeatureSummary", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary", "kind": "class", "doc": "<p>A generic class storing numeric feature statistics</p>\n"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.__init__", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">feature_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">minimum</span><span class=\"p\">:</span> <span class=\"nb\">float</span>,</span><span class=\"param\">\t<span class=\"n\">maximum</span><span class=\"p\">:</span> <span class=\"nb\">float</span>,</span><span class=\"param\">\t<span class=\"n\">median</span><span class=\"p\">:</span> <span class=\"nb\">float</span>,</span><span class=\"param\">\t<span class=\"n\">num_unique</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span>)</span>"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.feature_name", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.feature_name", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.minimum", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.minimum", "kind": "variable", "doc": "<p></p>\n", "annotation": ": float"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.maximum", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.maximum", "kind": "variable", "doc": "<p></p>\n", "annotation": ": float"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.median", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.median", "kind": "variable", "doc": "<p></p>\n", "annotation": ": float"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.num_unique", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.num_unique", "kind": "variable", "doc": "<p></p>\n", "annotation": ": int"}, {"fullname": "outrank.core_utils.NominalFeatureSummary", "modulename": "outrank.core_utils", "qualname": "NominalFeatureSummary", "kind": "class", "doc": "<p>A generic class storing numeric feature statistics</p>\n"}, {"fullname": "outrank.core_utils.NominalFeatureSummary.__init__", "modulename": "outrank.core_utils", "qualname": "NominalFeatureSummary.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">feature_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">num_unique</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span>)</span>"}, {"fullname": "outrank.core_utils.NominalFeatureSummary.feature_name", "modulename": "outrank.core_utils", "qualname": "NominalFeatureSummary.feature_name", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str"}, {"fullname": "outrank.core_utils.NominalFeatureSummary.num_unique", "modulename": "outrank.core_utils", "qualname": "NominalFeatureSummary.num_unique", "kind": "variable", "doc": "<p></p>\n", "annotation": ": int"}, {"fullname": "outrank.core_utils.BatchRankingSummary", "modulename": "outrank.core_utils", "qualname": "BatchRankingSummary", "kind": "class", "doc": "<p>A generic class representing batched ranking results</p>\n"}, {"fullname": "outrank.core_utils.BatchRankingSummary.__init__", "modulename": "outrank.core_utils", "qualname": "BatchRankingSummary.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplet_scores</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">step_times</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span></span>)</span>"}, {"fullname": "outrank.core_utils.BatchRankingSummary.triplet_scores", "modulename": "outrank.core_utils", "qualname": "BatchRankingSummary.triplet_scores", "kind": "variable", "doc": "<p></p>\n", "annotation": ": list[tuple[str, str, float]]"}, {"fullname": "outrank.core_utils.BatchRankingSummary.step_times", "modulename": "outrank.core_utils", "qualname": "BatchRankingSummary.step_times", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[str, typing.Any]"}, {"fullname": "outrank.core_utils.display_random_tip", "modulename": "outrank.core_utils", "qualname": "display_random_tip", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.get_dataset_info", "modulename": "outrank.core_utils", "qualname": "get_dataset_info", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.display_tool_name", "modulename": "outrank.core_utils", "qualname": "display_tool_name", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_line", "modulename": "outrank.core_utils", "qualname": "parse_ob_line", "kind": "function", "doc": "<p>Outbrain line parsing - generic TSVs</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">line_string</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;</span><span class=\"se\">\\t</span><span class=\"s1\">&#39;</span>, </span><span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_line_vw", "modulename": "outrank.core_utils", "qualname": "parse_ob_line_vw", "kind": "function", "doc": "<p>Parse a sparse vw line into a pandas df with pre-defined namespace</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">line_string</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">fw_col_mapping</span><span class=\"o\">=</span><span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">table_header</span><span class=\"o\">=</span><span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">include_namespace_info</span><span class=\"o\">=</span><span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span> <span class=\"o\">|</span> <span class=\"kc\">None</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_csv_line", "modulename": "outrank.core_utils", "qualname": "parse_ob_csv_line", "kind": "function", "doc": "<p>Data can have commas within JSON field dumps</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">line_string</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;,&#39;</span>, </span><span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.generic_line_parser", "modulename": "outrank.core_utils", "qualname": "generic_line_parser", "kind": "function", "doc": "<p>A generic method aimed to parse data from different sources.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">line_string</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">fw_col_mapping</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">table_header</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.read_reference_json", "modulename": "outrank.core_utils", "qualname": "read_reference_json", "kind": "function", "doc": "<p>A helper method for reading a JSON</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">json_path</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">dict</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_namespace", "modulename": "outrank.core_utils", "qualname": "parse_namespace", "kind": "function", "doc": "<p>Parse the feature namespace for type awareness</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">namespace_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.read_column_names", "modulename": "outrank.core_utils", "qualname": "read_column_names", "kind": "function", "doc": "<p>Read the col. header</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">mapping_file</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_vw_feature_information", "modulename": "outrank.core_utils", "qualname": "parse_ob_vw_feature_information", "kind": "function", "doc": "<p>A generic parser of ob-based data</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_raw_feature_information", "modulename": "outrank.core_utils", "qualname": "parse_ob_raw_feature_information", "kind": "function", "doc": "<p>A generic parser of ob-based data</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_feature_information", "modulename": "outrank.core_utils", "qualname": "parse_ob_feature_information", "kind": "function", "doc": "<p>A generic parser of ob-based data</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_csv_with_description_information", "modulename": "outrank.core_utils", "qualname": "parse_csv_with_description_information", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_csv_raw", "modulename": "outrank.core_utils", "qualname": "parse_csv_raw", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.extract_features_from_reference_JSON", "modulename": "outrank.core_utils", "qualname": "extract_features_from_reference_JSON", "kind": "function", "doc": "<p>Given a model's JSON, extract unique features</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">json_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">combined_features_only</span><span class=\"o\">=</span><span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">all_features</span><span class=\"o\">=</span><span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.summarize_feature_bounds_for_transformers", "modulename": "outrank.core_utils", "qualname": "summarize_feature_bounds_for_transformers", "kind": "function", "doc": "<p>summarization auxilliary method for generating JSON-based specs</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">bounds_object_storage</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">feature_types</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">task_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">label_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">granularity</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">15</span>,</span><span class=\"param\">\t<span class=\"n\">output_summary_table_only</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.summarize_rare_counts", "modulename": "outrank.core_utils", "qualname": "summarize_rare_counts", "kind": "function", "doc": "<p>Write rare values</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">term_counter</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">cardinality_object</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">object_info</span><span class=\"p\">:</span> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.is_prior_heuristic", "modulename": "outrank.core_utils", "qualname": "is_prior_heuristic", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">bool</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.get_num_of_instances", "modulename": "outrank.core_utils", "qualname": "get_num_of_instances", "kind": "function", "doc": "<p>Count the number of lines in a file, fast - useful for progress logging</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">fname</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">int</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.feature_transformations", "modulename": "outrank.feature_transformations", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault", "modulename": "outrank.feature_transformations.feature_transformer_vault", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.default_transformers", "modulename": "outrank.feature_transformations.feature_transformer_vault.default_transformers", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS", "modulename": "outrank.feature_transformations.feature_transformer_vault.default_transformers", "qualname": "MINIMAL_TRANSFORMERS", "kind": "variable", "doc": "<p></p>\n", "default_value": "{&#x27;_tr_sqrt&#x27;: &#x27;np.sqrt(X)&#x27;, &#x27;_tr_log(x+1)&#x27;: &#x27;np.log(X + 1)&#x27;, &#x27;_tr_sqrt(abs(x))&#x27;: &#x27;np.sqrt(np.abs(X))&#x27;, &#x27;_tr_log(abs(x)+1)&#x27;: &#x27;np.log(np.abs(X) + 1)&#x27;}"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS", "modulename": "outrank.feature_transformations.feature_transformer_vault.default_transformers", "qualname": "DEFAULT_TRANSFORMERS", "kind": "variable", "doc": "<p></p>\n", "default_value": "{&#x27;_tr_sqrt&#x27;: &#x27;np.sqrt(X)&#x27;, &#x27;_tr_log(x+1)&#x27;: &#x27;np.log(X + 1)&#x27;, &#x27;_tr_sqrt(abs(x))&#x27;: &#x27;np.sqrt(np.abs(X))&#x27;, &#x27;_tr_log(abs(x)+1)&#x27;: &#x27;np.log(np.abs(X) + 1)&#x27;, &#x27;_tr_div(x,abs(x))*log(abs(x))&#x27;: &#x27;np.divide(X, np.abs(X)) * np.log(np.abs(X))&#x27;, &#x27;_tr_log(x + sqrt(pow(x,2), 1)&#x27;: &#x27;np.log(X + np.sqrt(np.power(X, 2) + 1))&#x27;, &#x27;_tr_log*sqrt&#x27;: &#x27;np.log(X + 1) * np.sqrt(X)&#x27;, &#x27;_tr_log*100&#x27;: &#x27;np.round(np.log(X + 1) * 100, 0)&#x27;, &#x27;_tr_nonzero&#x27;: &#x27;np.where(X != 0, 1, 0)&#x27;, &#x27;_tr_round(div(x,max))&#x27;: &#x27;np.round(np.divide(X, np.max(X)), 0)&#x27;}"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "modulename": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS", "modulename": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "qualname": "FW_TRANSFORMERS", "kind": "variable", "doc": "<p></p>\n", "default_value": "{&#x27;_tr_sqrt&#x27;: &#x27;np.sqrt(X)&#x27;, &#x27;_tr_log(x+1)&#x27;: &#x27;np.log(X + 1)&#x27;, &#x27;_tr_sqrt(abs(x))&#x27;: &#x27;np.sqrt(np.abs(X))&#x27;, &#x27;_tr_log(abs(x)+1)&#x27;: &#x27;np.log(np.abs(X) + 1)&#x27;, &#x27;_tr_div(x,abs(x))*log(abs(x))&#x27;: &#x27;np.divide(X, np.abs(X)) * np.log(np.abs(X))&#x27;, &#x27;_tr_log(x + sqrt(pow(x,2), 1)&#x27;: &#x27;np.log(X + np.sqrt(np.power(X, 2) + 1))&#x27;, &#x27;_tr_log*sqrt&#x27;: &#x27;np.log(X + 1) * np.sqrt(X)&#x27;, &#x27;_tr_log*100&#x27;: &#x27;np.round(np.log(X + 1) * 100, 0)&#x27;, &#x27;_tr_nonzero&#x27;: &#x27;np.where(X != 0, 1, 0)&#x27;, &#x27;_tr_round(div(x,max))&#x27;: &#x27;np.round(np.divide(X, np.max(X)), 0)&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_1&#x27;: &#x27;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_1&#x27;: &#x27;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_2&#x27;: &#x27;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_2&#x27;: &#x27;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_4&#x27;: &#x27;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_4&#x27;: &#x27;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_8&#x27;: &#x27;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_8&#x27;: &#x27;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_16&#x27;: &#x27;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_16&#x27;: &#x27;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_32&#x27;: &#x27;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_32&#x27;: &#x27;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_64&#x27;: &#x27;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_64&#x27;: &#x27;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_96&#x27;: &#x27;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_96&#x27;: &#x27;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_1&#x27;: &#x27;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_1&#x27;: &#x27;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_2&#x27;: &#x27;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_2&#x27;: &#x27;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_4&#x27;: &#x27;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_4&#x27;: &#x27;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_8&#x27;: &#x27;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_8&#x27;: &#x27;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_16&#x27;: &#x27;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_16&#x27;: &#x27;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_32&#x27;: &#x27;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_32&#x27;: &#x27;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_64&#x27;: &#x27;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_64&#x27;: &#x27;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_96&#x27;: &#x27;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_96&#x27;: &#x27;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_1&#x27;: &#x27;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_1&#x27;: &#x27;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_2&#x27;: &#x27;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_2&#x27;: &#x27;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_4&#x27;: &#x27;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_4&#x27;: &#x27;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_8&#x27;: &#x27;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_8&#x27;: &#x27;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_16&#x27;: &#x27;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_16&#x27;: &#x27;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_32&#x27;: &#x27;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_32&#x27;: &#x27;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_64&#x27;: &#x27;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_64&#x27;: &#x27;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_96&#x27;: &#x27;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_96&#x27;: &#x27;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_1&#x27;: &#x27;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_1&#x27;: &#x27;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_2&#x27;: &#x27;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_2&#x27;: &#x27;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_4&#x27;: &#x27;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_4&#x27;: &#x27;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_8&#x27;: &#x27;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_8&#x27;: &#x27;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_16&#x27;: &#x27;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_16&#x27;: &#x27;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_32&#x27;: &#x27;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_32&#x27;: &#x27;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_64&#x27;: &#x27;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_64&#x27;: &#x27;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_96&#x27;: &#x27;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_96&#x27;: &#x27;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.01&#x27;: &#x27;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.01&#x27;: &#x27;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.02&#x27;: &#x27;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.02&#x27;: &#x27;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.04&#x27;: &#x27;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.04&#x27;: &#x27;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.08&#x27;: &#x27;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.08&#x27;: &#x27;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.16&#x27;: &#x27;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.16&#x27;: &#x27;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.32&#x27;: &#x27;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.32&#x27;: &#x27;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.64&#x27;: &#x27;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.64&#x27;: &#x27;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.96&#x27;: &#x27;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.96&#x27;: &#x27;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.01&#x27;: &#x27;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.01&#x27;: &#x27;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.02&#x27;: &#x27;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.02&#x27;: &#x27;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.04&#x27;: &#x27;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.04&#x27;: &#x27;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.08&#x27;: &#x27;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.08&#x27;: &#x27;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.16&#x27;: &#x27;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.16&#x27;: &#x27;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.32&#x27;: &#x27;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.32&#x27;: &#x27;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.64&#x27;: &#x27;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.64&#x27;: &#x27;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.96&#x27;: &#x27;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.96&#x27;: &#x27;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.01&#x27;: &#x27;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.01&#x27;: &#x27;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.02&#x27;: &#x27;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.02&#x27;: &#x27;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.04&#x27;: &#x27;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.04&#x27;: &#x27;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.08&#x27;: &#x27;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.08&#x27;: &#x27;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.16&#x27;: &#x27;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.16&#x27;: &#x27;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.32&#x27;: &#x27;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.32&#x27;: &#x27;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.64&#x27;: &#x27;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.64&#x27;: &#x27;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.96&#x27;: &#x27;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.96&#x27;: &#x27;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.01&#x27;: &#x27;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.01&#x27;: &#x27;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.02&#x27;: &#x27;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.02&#x27;: &#x27;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.04&#x27;: &#x27;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.04&#x27;: &#x27;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.08&#x27;: &#x27;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.08&#x27;: &#x27;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.16&#x27;: &#x27;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.16&#x27;: &#x27;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.32&#x27;: &#x27;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.32&#x27;: &#x27;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.64&#x27;: &#x27;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.64&#x27;: &#x27;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.96&#x27;: &#x27;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.96&#x27;: &#x27;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*100,0), 0))&#x27;}"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range", "modulename": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "qualname": "resolution_range", "kind": "variable", "doc": "<p></p>\n", "default_value": "[1, 10, 50, 100]"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range", "modulename": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "qualname": "greater_than_range", "kind": "variable", "doc": "<p></p>\n", "default_value": "[1, 2, 4, 8, 16, 32, 64, 96]"}, {"fullname": "outrank.feature_transformations.ranking_transformers", "modulename": "outrank.feature_transformations.ranking_transformers", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerNoise", "kind": "class", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerNoise.noise_preset", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerNoise.construct_new_features", "kind": "function", "doc": "<p>Generate a few standard noise distributions</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>, </span><span class=\"param\"><span class=\"n\">label_column</span><span class=\"o\">=</span><span class=\"kc\">None</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric", "kind": "class", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">numeric_column_names</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>, </span><span class=\"param\"><span class=\"n\">preset</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;default&#39;</span></span>)</span>"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.numeric_column_names", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.constructed_feature_names", "kind": "variable", "doc": "<p></p>\n", "annotation": ": set[str]"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.max_maj_support", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.nan_prop_support", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.get_vals", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">tmp_df</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>, </span><span class=\"param\"><span class=\"n\">col_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.construct_baseline_features", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">dataframe</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.construct_new_features", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">dataframe</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_generators", "modulename": "outrank.task_generators", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_generators.logger", "modulename": "outrank.task_generators", "qualname": "logger", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;Logger syn-logger (DEBUG)&gt;"}, {"fullname": "outrank.task_generators.outrank_task_generate_data_set", "modulename": "outrank.task_generators", "qualname": "outrank_task_generate_data_set", "kind": "function", "doc": "<p>Core method for generating data sets</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_instance_ranking", "modulename": "outrank.task_instance_ranking", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_instance_ranking.shannon_ent", "modulename": "outrank.task_instance_ranking", "qualname": "shannon_ent", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">string</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">float</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_instance_ranking.compute_entropy_avg", "modulename": "outrank.task_instance_ranking", "qualname": "compute_entropy_avg", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">line</span><span class=\"p\">:</span> <span class=\"nb\">list</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">float</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_instance_ranking.score_line", "modulename": "outrank.task_instance_ranking", "qualname": "score_line", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">line</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_instance_ranking.outrank_task_rank_instances", "modulename": "outrank.task_instance_ranking", "qualname": "outrank_task_rank_instances", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_ranking", "modulename": "outrank.task_ranking", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_ranking.outrank_task_conduct_ranking", "modulename": "outrank.task_ranking", "qualname": "outrank_task_conduct_ranking", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_selftest", "modulename": "outrank.task_selftest", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_selftest.logger", "modulename": "outrank.task_selftest", "qualname": "logger", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;Logger syn-logger (DEBUG)&gt;"}, {"fullname": "outrank.task_selftest.conduct_self_test", "modulename": "outrank.task_selftest", "qualname": "conduct_self_test", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_summary", "modulename": "outrank.task_summary", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_summary.outrank_task_result_summary", "modulename": "outrank.task_summary", "qualname": "outrank_task_result_summary", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_visualization", "modulename": "outrank.task_visualization", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_visualization.outrank_task_visualize_results", "modulename": "outrank.task_visualization", "qualname": "outrank_task_visualize_results", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.visualizations", "modulename": "outrank.visualizations", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.visualizations.ranking_visualization", "modulename": "outrank.visualizations.ranking_visualization", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters", "modulename": "outrank.visualizations.ranking_visualization", "qualname": "visualize_hierarchical_clusters", "kind": "function", "doc": "<p>A method for visualization of hierarchical clusters w.r.t. different linkage functions</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplet_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">output_folder</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">image_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;png&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">max_num_clusters</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">100</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.visualizations.ranking_visualization.visualize_heatmap", "modulename": "outrank.visualizations.ranking_visualization", "qualname": "visualize_heatmap", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplets</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">output_folder</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">image_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.visualizations.ranking_visualization.visualize_barplots", "modulename": "outrank.visualizations.ranking_visualization", "qualname": "visualize_barplots", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplets</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">output_folder</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">reference_json</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">image_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">label</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">heuristic</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.visualizations.ranking_visualization.visualize_all", "modulename": "outrank.visualizations.ranking_visualization", "qualname": "visualize_all", "kind": "function", "doc": "<p>A method for visualization of the obtained feature interaction maps.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplets</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">output_folder</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">label</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">reference_json</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">image_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;png&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">heuristic</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;MI&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}];
 
     // mirrored in build-search-index.js (part 1)
     // Also split on html tags. this is a cheap heuristic, but good enough.
@@ -43,4 +43,4 @@ window.pdocSearch = (function(){
         },
         expand: true
     });
-})();
+})();
\ No newline at end of file

From 18c6cb8ed38ccca31021b1b430bb5b075951a4c5 Mon Sep 17 00:00:00 2001
From: 98MM <47939788+98MM@users.noreply.github.com>
Date: Mon, 15 Jul 2024 11:55:42 +0200
Subject: [PATCH 8/9] updated documentation with changes after merging PR

---
 docs/outrank.html                             |    5 +-
 .../cc_generator.html                         | 4238 ++++++++---------
 docs/search.js                                |    2 +-
 3 files changed, 2079 insertions(+), 2166 deletions(-)

diff --git a/docs/outrank.html b/docs/outrank.html
index 6af2d42..b920250 100644
--- a/docs/outrank.html
+++ b/docs/outrank.html
@@ -164,9 +164,8 @@ <h2 id="creating-a-simple-dataset">Creating a simple dataset</h2>
 
                         <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos">1</span></a><span class="sd">&quot;&quot;&quot;</span>
 </span><span id="L-2"><a href="#L-2"><span class="linenos">2</span></a><span class="sd">.. include:: ../docs/DOCSMAIN.md</span>
-</span><span id="L-3"><a href="#L-3"><span class="linenos">3</span></a><span class="sd">.. include:: ../docs/generator_docs.md</span>
-</span><span id="L-4"><a href="#L-4"><span class="linenos">4</span></a><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="L-5"><a href="#L-5"><span class="linenos">5</span></a><span class="kn">from</span> <span class="nn">__future__</span> <span class="kn">import</span> <span class="n">annotations</span>
+</span><span id="L-3"><a href="#L-3"><span class="linenos">3</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-4"><a href="#L-4"><span class="linenos">4</span></a><span class="kn">from</span> <span class="nn">__future__</span> <span class="kn">import</span> <span class="n">annotations</span>
 </span></pre></div>
 
 
diff --git a/docs/outrank/algorithms/synthetic_data_generators/cc_generator.html b/docs/outrank/algorithms/synthetic_data_generators/cc_generator.html
index 7d97838..53423c6 100644
--- a/docs/outrank/algorithms/synthetic_data_generators/cc_generator.html
+++ b/docs/outrank/algorithms/synthetic_data_generators/cc_generator.html
@@ -33,6 +33,9 @@ <h2>API Documentation</h2>
             <li>
                     <a class="class" href="#CategoricalClassification">CategoricalClassification</a>
                             <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#CategoricalClassification.__init__">CategoricalClassification</a>
+                        </li>
                         <li>
                                 <a class="variable" href="#CategoricalClassification.dataset_info">dataset_info</a>
                         </li>
@@ -60,9 +63,6 @@ <h2>API Documentation</h2>
                         <li>
                                 <a class="function" href="#CategoricalClassification.print_dataset">print_dataset</a>
                         </li>
-                        <li>
-                                <a class="function" href="#CategoricalClassification.summarize">summarize</a>
-                        </li>
                 </ul>
 
             </li>
@@ -105,833 +105,804 @@ <h1 class="modulename">
 </span><span id="L-16"><a href="#L-16"><span class="linenos"> 16</span></a>
 </span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a><span class="k">class</span> <span class="nc">CategoricalClassification</span><span class="p">:</span>
 </span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a>
-</span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-</span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a>            <span class="s1">&#39;general&#39;</span><span class="p">:</span> <span class="p">{},</span>
-</span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a>            <span class="s1">&#39;combinations&#39;</span><span class="p">:</span> <span class="p">[],</span>
-</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a>            <span class="s1">&#39;correlations&#39;</span><span class="p">:</span> <span class="p">[],</span>
-</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a>            <span class="s1">&#39;duplicates&#39;</span><span class="p">:</span> <span class="p">[],</span>
-</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a>            <span class="s1">&#39;labels&#39;</span><span class="p">:</span> <span class="p">[],</span>
-</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a>            <span class="s1">&#39;noise&#39;</span><span class="p">:</span> <span class="p">[],</span>
-</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a>        <span class="p">}</span>
-</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a>
-</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a>    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a>        <span class="k">return</span> <span class="sa">f</span><span class="s2">&quot;CategoricalClassification(dataset_info=</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="si">}</span><span class="s2">)&quot;</span>
-</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a>
-</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a>    <span class="k">def</span> <span class="nf">generate_data</span><span class="p">(</span>
-</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a>        <span class="n">n_features</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a>        <span class="n">n_samples</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a>        <span class="n">cardinality</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
-</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a>        <span class="n">structure</span><span class="p">:</span> <span class="nb">list</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
-</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
-</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
-</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a>
-</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a><span class="sd">        Generates dataset based on given parameters</span>
-</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a><span class="sd">        :param n_features: number of generated features</span>
-</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a><span class="sd">        :param n_samples: number of generated samples</span>
-</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a><span class="sd">        :param cardinality: default cardinality of the dataset</span>
-</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a><span class="sd">        :param structure: structure of the dataset</span>
-</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a><span class="sd">        :param ensure_rep: flag, ensures all given values represented</span>
-</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a><span class="sd">        :param random_values: flag, enables random (integer) feature values from set [low, high]</span>
-</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a><span class="sd">        :param low: sets lower bound of random feature values</span>
-</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a><span class="sd">        :param high: sets high bound of random feature values</span>
-</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a><span class="sd">        :param seed: sets seed of numpy random</span>
-</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a><span class="sd">        :return: X, 2D dataset</span>
-</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a>
-</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
-</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>            <span class="s1">&#39;general&#39;</span><span class="p">:</span> <span class="p">{</span>
-</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a>                <span class="s1">&#39;n_features&#39;</span><span class="p">:</span> <span class="n">n_features</span><span class="p">,</span>
-</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a>                <span class="s1">&#39;n_samples&#39;</span><span class="p">:</span> <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a>                <span class="s1">&#39;cardinality&#39;</span><span class="p">:</span> <span class="n">cardinality</span><span class="p">,</span>
-</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a>                <span class="s1">&#39;structure&#39;</span><span class="p">:</span> <span class="n">structure</span><span class="p">,</span>
-</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>                <span class="s1">&#39;ensure_rep&#39;</span><span class="p">:</span> <span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a>                <span class="s1">&#39;seed&#39;</span><span class="p">:</span> <span class="n">seed</span><span class="p">,</span>
-</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a>            <span class="p">},</span>
-</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a>        <span class="p">})</span>
-</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a>
-</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">seed</span><span class="p">(</span><span class="n">seed</span><span class="p">)</span>
-</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>        <span class="n">X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">empty</span><span class="p">([</span><span class="n">n_features</span><span class="p">,</span> <span class="n">n_samples</span><span class="p">])</span>
-</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a>
-</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a>        <span class="k">if</span> <span class="n">structure</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a>            <span class="c1"># No specific structure parameter passed</span>
-</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
-</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a>                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
-</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a>                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a>                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a>                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a>                <span class="p">)</span>
-</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a>                <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>            <span class="c1"># Structure parameter passed, building based on structure</span>
-</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a>            <span class="n">ix</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a>            <span class="k">for</span> <span class="n">data</span> <span class="ow">in</span> <span class="n">structure</span><span class="p">:</span>
-</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a>                <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">data</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a>                    <span class="c1"># Data in structure is a tuple of (feature index (integer), feature attributes)</span>
-</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a>                    <span class="n">feature_ix</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
-</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a>
-</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a>                    <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
-</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a>                        <span class="c1"># Filling out the dataset up to column index feature_ix</span>
-</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a>                        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
-</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a>                            <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a>                                <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a>                                <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
-</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>                                <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a>                                <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a>                                <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a>                                <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a>                            <span class="p">)</span>
-</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a>                            <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>                            <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a>
-</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
-</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a>                        <span class="n">feature_attributes</span><span class="p">,</span>
-</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a>                    <span class="p">)</span>
-</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a>                    <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a>
-</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a>                    <span class="c1"># Data in structure is a tuple of (list of feature indexes, feature attributes)</span>
-</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a>                    <span class="n">feature_ixs</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
-</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a>
-</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a>                    <span class="k">for</span> <span class="n">feature_ix</span> <span class="ow">in</span> <span class="n">feature_ixs</span><span class="p">:</span>
-</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a>                        <span class="c1"># Filling out the dataset up to feature_ix</span>
-</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>                        <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
-</span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>                            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
-</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a>                                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a>                                    <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a>                                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
-</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a>                                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a>                                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a>                                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a>                                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a>                                <span class="p">)</span>
-</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a>                                <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a>                                <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a>
-</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a>                        <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
-</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a>                            <span class="n">feature_attributes</span><span class="p">,</span>
-</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a>                            <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a>                            <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a>                            <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a>                            <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a>                            <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a>                        <span class="p">)</span>
-</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a>
-</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a>                        <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a>                        <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a>
-</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a>            <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">n_features</span><span class="p">:</span>
-</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a>                <span class="c1"># Fill out the rest of the dataset</span>
-</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">n_features</span><span class="p">):</span>
-</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a>                        <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
-</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a>                    <span class="p">)</span>
-</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a>
-</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a>        <span class="k">return</span> <span class="n">X</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">):</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">seed</span><span class="p">(</span><span class="n">seed</span><span class="p">)</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a>            <span class="s1">&#39;general&#39;</span><span class="p">:</span> <span class="p">{},</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a>            <span class="s1">&#39;combinations&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a>            <span class="s1">&#39;correlations&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a>            <span class="s1">&#39;duplicates&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a>            <span class="s1">&#39;labels&#39;</span><span class="p">:</span> <span class="p">{},</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a>            <span class="s1">&#39;noise&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a>        <span class="p">}</span>
+</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a>
+</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a>    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a>        <span class="k">return</span> <span class="sa">f</span><span class="s2">&quot;CategoricalClassification(dataset_info=</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="si">}</span><span class="s2">)&quot;</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a>
+</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a>    <span class="k">def</span> <span class="nf">generate_data</span><span class="p">(</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a>        <span class="n">n_features</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a>        <span class="n">n_samples</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a>        <span class="n">cardinality</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a>        <span class="n">structure</span><span class="p">:</span> <span class="nb">list</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a>
+</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a><span class="sd">        Generates dataset based on given parameters</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a><span class="sd">        :param n_features: number of generated features</span>
+</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a><span class="sd">        :param n_samples: number of generated samples</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a><span class="sd">        :param cardinality: default cardinality of the dataset</span>
+</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a><span class="sd">        :param structure: structure of the dataset</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a><span class="sd">        :param ensure_rep: flag, ensures all given values represented</span>
+</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a><span class="sd">        :param random_values: flag, enables random (integer) feature values from set [low, high]</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a><span class="sd">        :param low: sets lower bound of random feature values</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a><span class="sd">        :param high: sets high bound of random feature values</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a><span class="sd">        :param seed: sets seed of numpy random</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a><span class="sd">        :return: X, 2D dataset</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a>
+</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a>            <span class="s1">&#39;general&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a>                <span class="s1">&#39;n_features&#39;</span><span class="p">:</span> <span class="n">n_features</span><span class="p">,</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a>                <span class="s1">&#39;n_samples&#39;</span><span class="p">:</span> <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a>                <span class="s1">&#39;cardinality&#39;</span><span class="p">:</span> <span class="n">cardinality</span><span class="p">,</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>                <span class="s1">&#39;structure&#39;</span><span class="p">:</span> <span class="n">structure</span><span class="p">,</span>
+</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a>                <span class="s1">&#39;ensure_rep&#39;</span><span class="p">:</span> <span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a>                <span class="s1">&#39;seed&#39;</span><span class="p">:</span> <span class="n">seed</span><span class="p">,</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a>            <span class="p">},</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a>        <span class="p">})</span>
+</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>
+</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">seed</span><span class="p">(</span><span class="n">seed</span><span class="p">)</span>
+</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a>        <span class="n">X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">empty</span><span class="p">([</span><span class="n">n_features</span><span class="p">,</span> <span class="n">n_samples</span><span class="p">])</span>
+</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a>
+</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a>        <span class="c1"># No specific structure parameter passed</span>
+</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a>        <span class="k">if</span> <span class="n">structure</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
+</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a>                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a>                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a>                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a>                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a>                <span class="p">)</span>
+</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a>                <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>        <span class="c1"># Structure parameter passed, building based on structure</span>
+</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a>            <span class="n">ix</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a>            <span class="k">for</span> <span class="n">data</span> <span class="ow">in</span> <span class="n">structure</span><span class="p">:</span>
+</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a>
+</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a>                <span class="c1"># Data in structure is a tuple of (feature index (integer), feature attributes)</span>
+</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a>                <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">data</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a>                    <span class="n">feature_ix</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
+</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a>
+</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a>                    <span class="c1"># Filling out the dataset up to column index feature_ix</span>
+</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a>                    <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
+</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a>                        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
+</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a>                            <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>                                <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a>                                <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a>                                <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a>                                <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a>                                <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a>                                <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>                            <span class="p">)</span>
+</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a>                            <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a>                            <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a>
+</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
+</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a>                        <span class="n">feature_attributes</span><span class="p">,</span>
+</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a>                    <span class="p">)</span>
+</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a>                    <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a>
+</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a>                <span class="c1"># Data in structure is a tuple of (list of feature indexes, feature attributes)</span>
+</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a>                    <span class="n">feature_ixs</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
+</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a>
+</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>                    <span class="c1"># Filling out the dataset up to feature_ix</span>
+</span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>                    <span class="k">for</span> <span class="n">feature_ix</span> <span class="ow">in</span> <span class="n">feature_ixs</span><span class="p">:</span>
+</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a>                        <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
+</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a>                            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
+</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a>                                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a>                                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a>                                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a>                                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a>                                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a>                                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a>                                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a>                                <span class="p">)</span>
+</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a>                                <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a>                                <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a>
+</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a>                        <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
+</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a>                            <span class="n">feature_attributes</span><span class="p">,</span>
+</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a>                            <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a>                            <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a>                            <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a>                            <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a>                            <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a>                        <span class="p">)</span>
+</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a>
+</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a>                        <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a>                        <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a>
+</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a>            <span class="c1"># Fill out the rest of the dataset</span>
+</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a>            <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">n_features</span><span class="p">:</span>
+</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">n_features</span><span class="p">):</span>
+</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a>                        <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a>                    <span class="p">)</span>
+</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
 </span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a>
-</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a>    <span class="k">def</span> <span class="nf">_configure_generate_feature</span><span class="p">(</span>
-</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a>        <span class="n">feature_attributes</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">list</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>        <span class="n">n_samples</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
-</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
-</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a>
-</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a><span class="sd">        Helper function, calls _generate_feature with appropriate parameters based on feature_attributes</span>
-</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a><span class="sd">        :param feature_attributes: either integer (cardinality) or list of feature attributes</span>
-</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a><span class="sd">        :param n_samples: number of samples in dataset</span>
-</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a><span class="sd">        :param ensure_rep: ensures all values are represented at least once in the feature vector</span>
-</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a><span class="sd">        :param random_values: randomly picked values for vec if true, otherwise values range from [low, cardinality] with by 1</span>
-</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a><span class="sd">        :param low: lower bound of random feature vector values</span>
-</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a><span class="sd">        :param high: upper bound of random feature vector values</span>
-</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a><span class="sd">        :return: feature vector</span>
-</span><span id="L-183"><a href="#L-183"><span class="linenos">183</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a>
-</span><span id="L-185"><a href="#L-185"><span class="linenos">185</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_attributes</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a>            <span class="c1"># feature_cardinality is just an integer, generate feature either with random values or</span>
-</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a>            <span class="c1"># [low, low+cardinality]</span>
-</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a>            <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a>                <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a>                <span class="n">cardinality</span><span class="o">=</span><span class="n">feature_attributes</span><span class="p">,</span>
-</span><span id="L-191"><a href="#L-191"><span class="linenos">191</span></a>                <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a>                <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a>                <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a>                <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a>            <span class="p">)</span>
-</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a>            <span class="c1"># feature_cardinality is a list of [value_domain, value_frequencies]</span>
-</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a>            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_attributes</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a>                <span class="n">value_domain</span><span class="p">,</span> <span class="n">value_frequencies</span> <span class="o">=</span> <span class="n">feature_attributes</span>
-</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a>                    <span class="n">vec</span><span class="o">=</span><span class="n">value_domain</span><span class="p">,</span>
-</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a>                    <span class="n">p</span><span class="o">=</span><span class="n">value_frequencies</span><span class="p">,</span>
-</span><span id="L-205"><a href="#L-205"><span class="linenos">205</span></a>                <span class="p">)</span>
-</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a>                <span class="c1"># feature_cardinality is value_domain (list of values for feature)</span>
-</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a>                <span class="n">value_domain</span> <span class="o">=</span> <span class="n">feature_attributes</span>
-</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a>                    <span class="n">vec</span><span class="o">=</span><span class="n">value_domain</span><span class="p">,</span>
-</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a>                <span class="p">)</span>
-</span><span id="L-214"><a href="#L-214"><span class="linenos">214</span></a>
-</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a>        <span class="k">return</span> <span class="n">x</span>
+</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a>        <span class="k">return</span> <span class="n">X</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a>
+</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a>    <span class="k">def</span> <span class="nf">_configure_generate_feature</span><span class="p">(</span>
+</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a>        <span class="n">feature_attributes</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">list</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a>        <span class="n">n_samples</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
+</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
+</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a>
+</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a><span class="sd">        Helper function, calls _generate_feature with appropriate parameters based on feature_attributes</span>
+</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a><span class="sd">        :param feature_attributes: either integer (cardinality) or list of feature attributes</span>
+</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a><span class="sd">        :param n_samples: number of samples in dataset</span>
+</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a><span class="sd">        :param ensure_rep: ensures all values are represented at least once in the feature vector</span>
+</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a><span class="sd">        :param random_values: randomly picked values for vec if true, otherwise values range from [low, cardinality] with by 1</span>
+</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a><span class="sd">        :param low: lower bound of random feature vector values</span>
+</span><span id="L-183"><a href="#L-183"><span class="linenos">183</span></a><span class="sd">        :param high: upper bound of random feature vector values</span>
+</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a><span class="sd">        :return: feature vector</span>
+</span><span id="L-185"><a href="#L-185"><span class="linenos">185</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a>
+</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a>        <span class="c1"># feature_cardinality is just an integer, generate feature either with random values or</span>
+</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a>        <span class="c1"># [low, low+cardinality]</span>
+</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_attributes</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a>            <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="L-191"><a href="#L-191"><span class="linenos">191</span></a>                <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a>                <span class="n">cardinality</span><span class="o">=</span><span class="n">feature_attributes</span><span class="p">,</span>
+</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a>                <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a>                <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a>                <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a>                <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a>            <span class="p">)</span>
+</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a>        <span class="c1"># feature_cardinality is a list of [value_domain, value_frequencies]</span>
+</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a>            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_attributes</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a>                <span class="n">value_domain</span><span class="p">,</span> <span class="n">value_frequencies</span> <span class="o">=</span> <span class="n">feature_attributes</span>
+</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a>                    <span class="n">vec</span><span class="o">=</span><span class="n">value_domain</span><span class="p">,</span>
+</span><span id="L-205"><a href="#L-205"><span class="linenos">205</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a>                    <span class="n">p</span><span class="o">=</span><span class="n">value_frequencies</span><span class="p">,</span>
+</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a>                <span class="p">)</span>
+</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a>            <span class="c1"># feature_cardinality is value_domain (list of values for feature)</span>
+</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a>                <span class="n">value_domain</span> <span class="o">=</span> <span class="n">feature_attributes</span>
+</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a>                    <span class="n">vec</span><span class="o">=</span><span class="n">value_domain</span><span class="p">,</span>
+</span><span id="L-214"><a href="#L-214"><span class="linenos">214</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a>                <span class="p">)</span>
 </span><span id="L-216"><a href="#L-216"><span class="linenos">216</span></a>
-</span><span id="L-217"><a href="#L-217"><span class="linenos">217</span></a>    <span class="k">def</span> <span class="nf">_generate_feature</span><span class="p">(</span>
-</span><span id="L-218"><a href="#L-218"><span class="linenos">218</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="L-219"><a href="#L-219"><span class="linenos">219</span></a>        <span class="n">size</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="L-220"><a href="#L-220"><span class="linenos">220</span></a>        <span class="n">vec</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="L-221"><a href="#L-221"><span class="linenos">221</span></a>        <span class="n">cardinality</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
-</span><span id="L-222"><a href="#L-222"><span class="linenos">222</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="L-223"><a href="#L-223"><span class="linenos">223</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="L-224"><a href="#L-224"><span class="linenos">224</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
-</span><span id="L-225"><a href="#L-225"><span class="linenos">225</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
-</span><span id="L-226"><a href="#L-226"><span class="linenos">226</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="L-227"><a href="#L-227"><span class="linenos">227</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="L-228"><a href="#L-228"><span class="linenos">228</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="L-229"><a href="#L-229"><span class="linenos">229</span></a><span class="sd">        Generates feature vector of length size. Default probability density distribution is approximately normal, centred around a randomly picked value.</span>
-</span><span id="L-230"><a href="#L-230"><span class="linenos">230</span></a><span class="sd">        :param vec: list of feature values</span>
-</span><span id="L-231"><a href="#L-231"><span class="linenos">231</span></a><span class="sd">        :param cardinality: single value cardinality</span>
-</span><span id="L-232"><a href="#L-232"><span class="linenos">232</span></a><span class="sd">        :param size: length of feature vector</span>
-</span><span id="L-233"><a href="#L-233"><span class="linenos">233</span></a><span class="sd">        :param ensure_rep: ensures all values are represented at least once in the feature vector</span>
-</span><span id="L-234"><a href="#L-234"><span class="linenos">234</span></a><span class="sd">        :param random_values: randomly picked values for vec if true, otherwise values range from [low, cardinality] with by 1</span>
-</span><span id="L-235"><a href="#L-235"><span class="linenos">235</span></a><span class="sd">        :param low: lower bound of random feature vector values</span>
-</span><span id="L-236"><a href="#L-236"><span class="linenos">236</span></a><span class="sd">        :param high: upper bound of random feature vector values</span>
-</span><span id="L-237"><a href="#L-237"><span class="linenos">237</span></a><span class="sd">        :param p: list of probabilities of each value</span>
-</span><span id="L-238"><a href="#L-238"><span class="linenos">238</span></a><span class="sd">        :return: feature vector x</span>
-</span><span id="L-239"><a href="#L-239"><span class="linenos">239</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-240"><a href="#L-240"><span class="linenos">240</span></a>
-</span><span id="L-241"><a href="#L-241"><span class="linenos">241</span></a>        <span class="k">if</span> <span class="n">vec</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-242"><a href="#L-242"><span class="linenos">242</span></a>            <span class="k">if</span> <span class="n">random_values</span><span class="p">:</span>
-</span><span id="L-243"><a href="#L-243"><span class="linenos">243</span></a>                <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="n">low</span><span class="p">,</span> <span class="n">high</span> <span class="o">+</span> <span class="mi">1</span><span class="p">),</span> <span class="n">cardinality</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-</span><span id="L-244"><a href="#L-244"><span class="linenos">244</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="L-245"><a href="#L-245"><span class="linenos">245</span></a>                <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">low</span><span class="p">,</span> <span class="n">low</span> <span class="o">+</span> <span class="n">cardinality</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="L-246"><a href="#L-246"><span class="linenos">246</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-247"><a href="#L-247"><span class="linenos">247</span></a>            <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">vec</span><span class="p">)</span>
-</span><span id="L-248"><a href="#L-248"><span class="linenos">248</span></a>
-</span><span id="L-249"><a href="#L-249"><span class="linenos">249</span></a>        <span class="k">if</span> <span class="n">p</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-250"><a href="#L-250"><span class="linenos">250</span></a>            <span class="n">v_shift</span> <span class="o">=</span> <span class="n">vec</span> <span class="o">-</span> <span class="n">vec</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">))]</span>
-</span><span id="L-251"><a href="#L-251"><span class="linenos">251</span></a>            <span class="n">p</span> <span class="o">=</span> <span class="n">norm</span><span class="o">.</span><span class="n">pdf</span><span class="p">(</span><span class="n">v_shift</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="mi">3</span><span class="p">)</span>
-</span><span id="L-252"><a href="#L-252"><span class="linenos">252</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-253"><a href="#L-253"><span class="linenos">253</span></a>            <span class="n">p</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">p</span><span class="p">)</span>
-</span><span id="L-254"><a href="#L-254"><span class="linenos">254</span></a>
-</span><span id="L-255"><a href="#L-255"><span class="linenos">255</span></a>        <span class="n">p</span> <span class="o">=</span> <span class="n">p</span> <span class="o">/</span> <span class="n">p</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span>
+</span><span id="L-217"><a href="#L-217"><span class="linenos">217</span></a>        <span class="k">return</span> <span class="n">x</span>
+</span><span id="L-218"><a href="#L-218"><span class="linenos">218</span></a>
+</span><span id="L-219"><a href="#L-219"><span class="linenos">219</span></a>    <span class="k">def</span> <span class="nf">_generate_feature</span><span class="p">(</span>
+</span><span id="L-220"><a href="#L-220"><span class="linenos">220</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-221"><a href="#L-221"><span class="linenos">221</span></a>        <span class="n">size</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-222"><a href="#L-222"><span class="linenos">222</span></a>        <span class="n">vec</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-223"><a href="#L-223"><span class="linenos">223</span></a>        <span class="n">cardinality</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
+</span><span id="L-224"><a href="#L-224"><span class="linenos">224</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-225"><a href="#L-225"><span class="linenos">225</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-226"><a href="#L-226"><span class="linenos">226</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
+</span><span id="L-227"><a href="#L-227"><span class="linenos">227</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
+</span><span id="L-228"><a href="#L-228"><span class="linenos">228</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-229"><a href="#L-229"><span class="linenos">229</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-230"><a href="#L-230"><span class="linenos">230</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-231"><a href="#L-231"><span class="linenos">231</span></a><span class="sd">        Generates feature vector of length size. Default probability density distribution is approximately normal, centred around a randomly picked value.</span>
+</span><span id="L-232"><a href="#L-232"><span class="linenos">232</span></a><span class="sd">        :param vec: list of feature values</span>
+</span><span id="L-233"><a href="#L-233"><span class="linenos">233</span></a><span class="sd">        :param cardinality: single value cardinality</span>
+</span><span id="L-234"><a href="#L-234"><span class="linenos">234</span></a><span class="sd">        :param size: length of feature vector</span>
+</span><span id="L-235"><a href="#L-235"><span class="linenos">235</span></a><span class="sd">        :param ensure_rep: ensures all values are represented at least once in the feature vector</span>
+</span><span id="L-236"><a href="#L-236"><span class="linenos">236</span></a><span class="sd">        :param random_values: randomly picked values for vec if true, otherwise values range from [low, cardinality] with by 1</span>
+</span><span id="L-237"><a href="#L-237"><span class="linenos">237</span></a><span class="sd">        :param low: lower bound of random feature vector values</span>
+</span><span id="L-238"><a href="#L-238"><span class="linenos">238</span></a><span class="sd">        :param high: upper bound of random feature vector values</span>
+</span><span id="L-239"><a href="#L-239"><span class="linenos">239</span></a><span class="sd">        :param p: list of probabilities of each value</span>
+</span><span id="L-240"><a href="#L-240"><span class="linenos">240</span></a><span class="sd">        :return: feature vector x</span>
+</span><span id="L-241"><a href="#L-241"><span class="linenos">241</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-242"><a href="#L-242"><span class="linenos">242</span></a>
+</span><span id="L-243"><a href="#L-243"><span class="linenos">243</span></a>        <span class="k">if</span> <span class="n">vec</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-244"><a href="#L-244"><span class="linenos">244</span></a>            <span class="k">if</span> <span class="n">random_values</span><span class="p">:</span>
+</span><span id="L-245"><a href="#L-245"><span class="linenos">245</span></a>                <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="n">low</span><span class="p">,</span> <span class="n">high</span> <span class="o">+</span> <span class="mi">1</span><span class="p">),</span> <span class="n">cardinality</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="L-246"><a href="#L-246"><span class="linenos">246</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="L-247"><a href="#L-247"><span class="linenos">247</span></a>                <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">low</span><span class="p">,</span> <span class="n">low</span> <span class="o">+</span> <span class="n">cardinality</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="L-248"><a href="#L-248"><span class="linenos">248</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-249"><a href="#L-249"><span class="linenos">249</span></a>            <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">vec</span><span class="p">)</span>
+</span><span id="L-250"><a href="#L-250"><span class="linenos">250</span></a>
+</span><span id="L-251"><a href="#L-251"><span class="linenos">251</span></a>        <span class="k">if</span> <span class="n">p</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-252"><a href="#L-252"><span class="linenos">252</span></a>            <span class="n">v_shift</span> <span class="o">=</span> <span class="n">vec</span> <span class="o">-</span> <span class="n">vec</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">))]</span>
+</span><span id="L-253"><a href="#L-253"><span class="linenos">253</span></a>            <span class="n">p</span> <span class="o">=</span> <span class="n">norm</span><span class="o">.</span><span class="n">pdf</span><span class="p">(</span><span class="n">v_shift</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="mi">3</span><span class="p">)</span>
+</span><span id="L-254"><a href="#L-254"><span class="linenos">254</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-255"><a href="#L-255"><span class="linenos">255</span></a>            <span class="n">p</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">p</span><span class="p">)</span>
 </span><span id="L-256"><a href="#L-256"><span class="linenos">256</span></a>
-</span><span id="L-257"><a href="#L-257"><span class="linenos">257</span></a>        <span class="k">if</span> <span class="n">ensure_rep</span> <span class="ow">and</span> <span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">)</span> <span class="o">&lt;</span> <span class="n">size</span><span class="p">:</span>
-</span><span id="L-258"><a href="#L-258"><span class="linenos">258</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">vec</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="p">(</span><span class="n">size</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">)),</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">)</span>
-</span><span id="L-259"><a href="#L-259"><span class="linenos">259</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">sampled_values</span><span class="p">,</span> <span class="n">vec</span><span class="p">)</span>
-</span><span id="L-260"><a href="#L-260"><span class="linenos">260</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-261"><a href="#L-261"><span class="linenos">261</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">vec</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="n">size</span><span class="p">,</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">)</span>
-</span><span id="L-262"><a href="#L-262"><span class="linenos">262</span></a>
-</span><span id="L-263"><a href="#L-263"><span class="linenos">263</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">sampled_values</span><span class="p">)</span>
-</span><span id="L-264"><a href="#L-264"><span class="linenos">264</span></a>        <span class="k">return</span> <span class="n">sampled_values</span>
-</span><span id="L-265"><a href="#L-265"><span class="linenos">265</span></a>
-</span><span id="L-266"><a href="#L-266"><span class="linenos">266</span></a>    <span class="k">def</span> <span class="nf">generate_combinations</span><span class="p">(</span>
-</span><span id="L-267"><a href="#L-267"><span class="linenos">267</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="L-268"><a href="#L-268"><span class="linenos">268</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="L-269"><a href="#L-269"><span class="linenos">269</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="L-270"><a href="#L-270"><span class="linenos">270</span></a>        <span class="n">combination_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="L-271"><a href="#L-271"><span class="linenos">271</span></a>        <span class="n">combination_type</span><span class="p">:</span> <span class="n">Literal</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
-</span><span id="L-272"><a href="#L-272"><span class="linenos">272</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="L-273"><a href="#L-273"><span class="linenos">273</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="L-274"><a href="#L-274"><span class="linenos">274</span></a><span class="sd">        Generates linear, nonlinear, or custom combinations within feature vectors in given dataset X</span>
-</span><span id="L-275"><a href="#L-275"><span class="linenos">275</span></a><span class="sd">        :param X: dataset</span>
-</span><span id="L-276"><a href="#L-276"><span class="linenos">276</span></a><span class="sd">        :param feature_indices: indexes of features to be in combination</span>
-</span><span id="L-277"><a href="#L-277"><span class="linenos">277</span></a><span class="sd">        :param combination_function: optional custom function for combining feature vectors</span>
-</span><span id="L-278"><a href="#L-278"><span class="linenos">278</span></a><span class="sd">        :param combination_type: string flag, either liner or nonlinear, defining combination type</span>
-</span><span id="L-279"><a href="#L-279"><span class="linenos">279</span></a><span class="sd">        :return: X with added resultant feature</span>
-</span><span id="L-280"><a href="#L-280"><span class="linenos">280</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-281"><a href="#L-281"><span class="linenos">281</span></a>
-</span><span id="L-282"><a href="#L-282"><span class="linenos">282</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="L-257"><a href="#L-257"><span class="linenos">257</span></a>        <span class="n">p</span> <span class="o">=</span> <span class="n">p</span> <span class="o">/</span> <span class="n">p</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span>
+</span><span id="L-258"><a href="#L-258"><span class="linenos">258</span></a>
+</span><span id="L-259"><a href="#L-259"><span class="linenos">259</span></a>        <span class="k">if</span> <span class="n">ensure_rep</span> <span class="ow">and</span> <span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">)</span> <span class="o">&lt;</span> <span class="n">size</span><span class="p">:</span>
+</span><span id="L-260"><a href="#L-260"><span class="linenos">260</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">vec</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="p">(</span><span class="n">size</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">)),</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">)</span>
+</span><span id="L-261"><a href="#L-261"><span class="linenos">261</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">sampled_values</span><span class="p">,</span> <span class="n">vec</span><span class="p">)</span>
+</span><span id="L-262"><a href="#L-262"><span class="linenos">262</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-263"><a href="#L-263"><span class="linenos">263</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">vec</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="n">size</span><span class="p">,</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">)</span>
+</span><span id="L-264"><a href="#L-264"><span class="linenos">264</span></a>
+</span><span id="L-265"><a href="#L-265"><span class="linenos">265</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">sampled_values</span><span class="p">)</span>
+</span><span id="L-266"><a href="#L-266"><span class="linenos">266</span></a>        <span class="k">return</span> <span class="n">sampled_values</span>
+</span><span id="L-267"><a href="#L-267"><span class="linenos">267</span></a>
+</span><span id="L-268"><a href="#L-268"><span class="linenos">268</span></a>    <span class="k">def</span> <span class="nf">generate_combinations</span><span class="p">(</span>
+</span><span id="L-269"><a href="#L-269"><span class="linenos">269</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-270"><a href="#L-270"><span class="linenos">270</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-271"><a href="#L-271"><span class="linenos">271</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-272"><a href="#L-272"><span class="linenos">272</span></a>        <span class="n">combination_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-273"><a href="#L-273"><span class="linenos">273</span></a>        <span class="n">combination_type</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;linear&#39;</span><span class="p">,</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
+</span><span id="L-274"><a href="#L-274"><span class="linenos">274</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-275"><a href="#L-275"><span class="linenos">275</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-276"><a href="#L-276"><span class="linenos">276</span></a><span class="sd">        Generates linear, nonlinear, or custom combinations within feature vectors in given dataset X</span>
+</span><span id="L-277"><a href="#L-277"><span class="linenos">277</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="L-278"><a href="#L-278"><span class="linenos">278</span></a><span class="sd">        :param feature_indices: indexes of features to be in combination</span>
+</span><span id="L-279"><a href="#L-279"><span class="linenos">279</span></a><span class="sd">        :param combination_function: optional custom function for combining feature vectors</span>
+</span><span id="L-280"><a href="#L-280"><span class="linenos">280</span></a><span class="sd">        :param combination_type: string flag, either liner or nonlinear, defining combination type</span>
+</span><span id="L-281"><a href="#L-281"><span class="linenos">281</span></a><span class="sd">        :return: X with added resultant feature</span>
+</span><span id="L-282"><a href="#L-282"><span class="linenos">282</span></a><span class="sd">        &quot;&quot;&quot;</span>
 </span><span id="L-283"><a href="#L-283"><span class="linenos">283</span></a>
-</span><span id="L-284"><a href="#L-284"><span class="linenos">284</span></a>        <span class="k">if</span> <span class="n">combination_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-285"><a href="#L-285"><span class="linenos">285</span></a>            <span class="k">if</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
-</span><span id="L-286"><a href="#L-286"><span class="linenos">286</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="L-287"><a href="#L-287"><span class="linenos">287</span></a>            <span class="k">elif</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
-</span><span id="L-288"><a href="#L-288"><span class="linenos">288</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">))</span>
-</span><span id="L-289"><a href="#L-289"><span class="linenos">289</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-290"><a href="#L-290"><span class="linenos">290</span></a>            <span class="n">combination_type</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">combination_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
-</span><span id="L-291"><a href="#L-291"><span class="linenos">291</span></a>
-</span><span id="L-292"><a href="#L-292"><span class="linenos">292</span></a>        <span class="n">combination_result</span> <span class="o">=</span> <span class="n">combination_function</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
+</span><span id="L-284"><a href="#L-284"><span class="linenos">284</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="L-285"><a href="#L-285"><span class="linenos">285</span></a>
+</span><span id="L-286"><a href="#L-286"><span class="linenos">286</span></a>        <span class="k">if</span> <span class="n">combination_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-287"><a href="#L-287"><span class="linenos">287</span></a>            <span class="k">if</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
+</span><span id="L-288"><a href="#L-288"><span class="linenos">288</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-289"><a href="#L-289"><span class="linenos">289</span></a>            <span class="k">elif</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
+</span><span id="L-290"><a href="#L-290"><span class="linenos">290</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="L-291"><a href="#L-291"><span class="linenos">291</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-292"><a href="#L-292"><span class="linenos">292</span></a>            <span class="n">combination_type</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">combination_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
 </span><span id="L-293"><a href="#L-293"><span class="linenos">293</span></a>
-</span><span id="L-294"><a href="#L-294"><span class="linenos">294</span></a>        <span class="n">combination_ix</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="L-294"><a href="#L-294"><span class="linenos">294</span></a>        <span class="n">combination_result</span> <span class="o">=</span> <span class="n">combination_function</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
 </span><span id="L-295"><a href="#L-295"><span class="linenos">295</span></a>
-</span><span id="L-296"><a href="#L-296"><span class="linenos">296</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="L-297"><a href="#L-297"><span class="linenos">297</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
-</span><span id="L-298"><a href="#L-298"><span class="linenos">298</span></a>            <span class="s1">&#39;combination_type&#39;</span><span class="p">:</span> <span class="n">combination_type</span><span class="p">,</span>
-</span><span id="L-299"><a href="#L-299"><span class="linenos">299</span></a>            <span class="s1">&#39;combination_ix&#39;</span><span class="p">:</span> <span class="n">combination_ix</span><span class="p">,</span>
-</span><span id="L-300"><a href="#L-300"><span class="linenos">300</span></a>        <span class="p">})</span>
-</span><span id="L-301"><a href="#L-301"><span class="linenos">301</span></a>
-</span><span id="L-302"><a href="#L-302"><span class="linenos">302</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">combination_result</span><span class="p">))</span>
+</span><span id="L-296"><a href="#L-296"><span class="linenos">296</span></a>        <span class="n">combination_ix</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="L-297"><a href="#L-297"><span class="linenos">297</span></a>
+</span><span id="L-298"><a href="#L-298"><span class="linenos">298</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="L-299"><a href="#L-299"><span class="linenos">299</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="L-300"><a href="#L-300"><span class="linenos">300</span></a>            <span class="s1">&#39;combination_type&#39;</span><span class="p">:</span> <span class="n">combination_type</span><span class="p">,</span>
+</span><span id="L-301"><a href="#L-301"><span class="linenos">301</span></a>            <span class="s1">&#39;combination_ix&#39;</span><span class="p">:</span> <span class="n">combination_ix</span><span class="p">,</span>
+</span><span id="L-302"><a href="#L-302"><span class="linenos">302</span></a>        <span class="p">})</span>
 </span><span id="L-303"><a href="#L-303"><span class="linenos">303</span></a>
-</span><span id="L-304"><a href="#L-304"><span class="linenos">304</span></a>    <span class="k">def</span> <span class="nf">_xor</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="L-305"><a href="#L-305"><span class="linenos">305</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="L-306"><a href="#L-306"><span class="linenos">306</span></a><span class="sd">        Performs bitwise XOR operation on two integer arrays</span>
-</span><span id="L-307"><a href="#L-307"><span class="linenos">307</span></a><span class="sd">        :param arr: features to perform XOR operation on</span>
-</span><span id="L-308"><a href="#L-308"><span class="linenos">308</span></a><span class="sd">        :return: bitwise XOR result</span>
-</span><span id="L-309"><a href="#L-309"><span class="linenos">309</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-310"><a href="#L-310"><span class="linenos">310</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
-</span><span id="L-311"><a href="#L-311"><span class="linenos">311</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
-</span><span id="L-312"><a href="#L-312"><span class="linenos">312</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
-</span><span id="L-313"><a href="#L-313"><span class="linenos">313</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="L-314"><a href="#L-314"><span class="linenos">314</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
-</span><span id="L-315"><a href="#L-315"><span class="linenos">315</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
-</span><span id="L-316"><a href="#L-316"><span class="linenos">316</span></a>
-</span><span id="L-317"><a href="#L-317"><span class="linenos">317</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-304"><a href="#L-304"><span class="linenos">304</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">combination_result</span><span class="p">))</span>
+</span><span id="L-305"><a href="#L-305"><span class="linenos">305</span></a>
+</span><span id="L-306"><a href="#L-306"><span class="linenos">306</span></a>    <span class="k">def</span> <span class="nf">_xor</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-307"><a href="#L-307"><span class="linenos">307</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-308"><a href="#L-308"><span class="linenos">308</span></a><span class="sd">        Performs bitwise XOR operation on two integer arrays</span>
+</span><span id="L-309"><a href="#L-309"><span class="linenos">309</span></a><span class="sd">        :param arr: features to perform XOR operation on</span>
+</span><span id="L-310"><a href="#L-310"><span class="linenos">310</span></a><span class="sd">        :return: bitwise XOR result</span>
+</span><span id="L-311"><a href="#L-311"><span class="linenos">311</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-312"><a href="#L-312"><span class="linenos">312</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-313"><a href="#L-313"><span class="linenos">313</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="L-314"><a href="#L-314"><span class="linenos">314</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="L-315"><a href="#L-315"><span class="linenos">315</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="L-316"><a href="#L-316"><span class="linenos">316</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
+</span><span id="L-317"><a href="#L-317"><span class="linenos">317</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
 </span><span id="L-318"><a href="#L-318"><span class="linenos">318</span></a>
-</span><span id="L-319"><a href="#L-319"><span class="linenos">319</span></a>    <span class="k">def</span> <span class="nf">_and</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="L-320"><a href="#L-320"><span class="linenos">320</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="L-321"><a href="#L-321"><span class="linenos">321</span></a><span class="sd">        Performs bitwise AND operation on two integer arrays</span>
-</span><span id="L-322"><a href="#L-322"><span class="linenos">322</span></a><span class="sd">        :param arr: features to perform AND operation on</span>
-</span><span id="L-323"><a href="#L-323"><span class="linenos">323</span></a><span class="sd">        :return: bitwise AND result</span>
-</span><span id="L-324"><a href="#L-324"><span class="linenos">324</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-325"><a href="#L-325"><span class="linenos">325</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
-</span><span id="L-326"><a href="#L-326"><span class="linenos">326</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
-</span><span id="L-327"><a href="#L-327"><span class="linenos">327</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
-</span><span id="L-328"><a href="#L-328"><span class="linenos">328</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="L-329"><a href="#L-329"><span class="linenos">329</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
-</span><span id="L-330"><a href="#L-330"><span class="linenos">330</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_and</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
-</span><span id="L-331"><a href="#L-331"><span class="linenos">331</span></a>
-</span><span id="L-332"><a href="#L-332"><span class="linenos">332</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-319"><a href="#L-319"><span class="linenos">319</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-320"><a href="#L-320"><span class="linenos">320</span></a>
+</span><span id="L-321"><a href="#L-321"><span class="linenos">321</span></a>    <span class="k">def</span> <span class="nf">_and</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-322"><a href="#L-322"><span class="linenos">322</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-323"><a href="#L-323"><span class="linenos">323</span></a><span class="sd">        Performs bitwise AND operation on two integer arrays</span>
+</span><span id="L-324"><a href="#L-324"><span class="linenos">324</span></a><span class="sd">        :param arr: features to perform AND operation on</span>
+</span><span id="L-325"><a href="#L-325"><span class="linenos">325</span></a><span class="sd">        :return: bitwise AND result</span>
+</span><span id="L-326"><a href="#L-326"><span class="linenos">326</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-327"><a href="#L-327"><span class="linenos">327</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-328"><a href="#L-328"><span class="linenos">328</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="L-329"><a href="#L-329"><span class="linenos">329</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="L-330"><a href="#L-330"><span class="linenos">330</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="L-331"><a href="#L-331"><span class="linenos">331</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
+</span><span id="L-332"><a href="#L-332"><span class="linenos">332</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_and</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
 </span><span id="L-333"><a href="#L-333"><span class="linenos">333</span></a>
-</span><span id="L-334"><a href="#L-334"><span class="linenos">334</span></a>    <span class="k">def</span> <span class="nf">_or</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="L-335"><a href="#L-335"><span class="linenos">335</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="L-336"><a href="#L-336"><span class="linenos">336</span></a><span class="sd">        Performs bitwise OR operation on two integer arrays</span>
-</span><span id="L-337"><a href="#L-337"><span class="linenos">337</span></a><span class="sd">        :param arr: features to perform OR operation on</span>
-</span><span id="L-338"><a href="#L-338"><span class="linenos">338</span></a><span class="sd">        :return: bitwise OR result</span>
-</span><span id="L-339"><a href="#L-339"><span class="linenos">339</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-340"><a href="#L-340"><span class="linenos">340</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
-</span><span id="L-341"><a href="#L-341"><span class="linenos">341</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
-</span><span id="L-342"><a href="#L-342"><span class="linenos">342</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
-</span><span id="L-343"><a href="#L-343"><span class="linenos">343</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="L-344"><a href="#L-344"><span class="linenos">344</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
-</span><span id="L-345"><a href="#L-345"><span class="linenos">345</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_or</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
-</span><span id="L-346"><a href="#L-346"><span class="linenos">346</span></a>
-</span><span id="L-347"><a href="#L-347"><span class="linenos">347</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-334"><a href="#L-334"><span class="linenos">334</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-335"><a href="#L-335"><span class="linenos">335</span></a>
+</span><span id="L-336"><a href="#L-336"><span class="linenos">336</span></a>    <span class="k">def</span> <span class="nf">_or</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-337"><a href="#L-337"><span class="linenos">337</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-338"><a href="#L-338"><span class="linenos">338</span></a><span class="sd">        Performs bitwise OR operation on two integer arrays</span>
+</span><span id="L-339"><a href="#L-339"><span class="linenos">339</span></a><span class="sd">        :param arr: features to perform OR operation on</span>
+</span><span id="L-340"><a href="#L-340"><span class="linenos">340</span></a><span class="sd">        :return: bitwise OR result</span>
+</span><span id="L-341"><a href="#L-341"><span class="linenos">341</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-342"><a href="#L-342"><span class="linenos">342</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-343"><a href="#L-343"><span class="linenos">343</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="L-344"><a href="#L-344"><span class="linenos">344</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="L-345"><a href="#L-345"><span class="linenos">345</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="L-346"><a href="#L-346"><span class="linenos">346</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
+</span><span id="L-347"><a href="#L-347"><span class="linenos">347</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_or</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
 </span><span id="L-348"><a href="#L-348"><span class="linenos">348</span></a>
-</span><span id="L-349"><a href="#L-349"><span class="linenos">349</span></a>    <span class="k">def</span> <span class="nf">generate_correlated</span><span class="p">(</span>
-</span><span id="L-350"><a href="#L-350"><span class="linenos">350</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="L-351"><a href="#L-351"><span class="linenos">351</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="L-352"><a href="#L-352"><span class="linenos">352</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="L-353"><a href="#L-353"><span class="linenos">353</span></a>        <span class="n">r</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.8</span><span class="p">,</span>
-</span><span id="L-354"><a href="#L-354"><span class="linenos">354</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="L-355"><a href="#L-355"><span class="linenos">355</span></a>
-</span><span id="L-356"><a href="#L-356"><span class="linenos">356</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="L-357"><a href="#L-357"><span class="linenos">357</span></a><span class="sd">        Generates correlated features using the given feature indices. Correlation is based on cosine of angle between vectors with mean 0.</span>
-</span><span id="L-358"><a href="#L-358"><span class="linenos">358</span></a><span class="sd">        :param X: dataset</span>
-</span><span id="L-359"><a href="#L-359"><span class="linenos">359</span></a><span class="sd">        :param feature_indices: indices of features to generate correlated feature to</span>
-</span><span id="L-360"><a href="#L-360"><span class="linenos">360</span></a><span class="sd">        :param r: (Pearson) correlation factor</span>
-</span><span id="L-361"><a href="#L-361"><span class="linenos">361</span></a><span class="sd">        :return: X with generated correlated  features</span>
-</span><span id="L-362"><a href="#L-362"><span class="linenos">362</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-363"><a href="#L-363"><span class="linenos">363</span></a>
-</span><span id="L-364"><a href="#L-364"><span class="linenos">364</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="L-365"><a href="#L-365"><span class="linenos">365</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
-</span><span id="L-366"><a href="#L-366"><span class="linenos">366</span></a>
-</span><span id="L-367"><a href="#L-367"><span class="linenos">367</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="L-368"><a href="#L-368"><span class="linenos">368</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)),</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="L-369"><a href="#L-369"><span class="linenos">369</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-370"><a href="#L-370"><span class="linenos">370</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
-</span><span id="L-371"><a href="#L-371"><span class="linenos">371</span></a>
-</span><span id="L-372"><a href="#L-372"><span class="linenos">372</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
-</span><span id="L-373"><a href="#L-373"><span class="linenos">373</span></a>        <span class="n">transposed</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
-</span><span id="L-374"><a href="#L-374"><span class="linenos">374</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-375"><a href="#L-375"><span class="linenos">375</span></a>
-</span><span id="L-376"><a href="#L-376"><span class="linenos">376</span></a>        <span class="k">for</span> <span class="n">t</span> <span class="ow">in</span> <span class="n">transposed</span><span class="p">:</span>
-</span><span id="L-377"><a href="#L-377"><span class="linenos">377</span></a>            <span class="n">theta</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arccos</span><span class="p">(</span><span class="n">r</span><span class="p">)</span>
-</span><span id="L-378"><a href="#L-378"><span class="linenos">378</span></a>            <span class="n">t_standard</span> <span class="o">=</span> <span class="p">(</span><span class="n">t</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">t</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">t</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
-</span><span id="L-379"><a href="#L-379"><span class="linenos">379</span></a>
-</span><span id="L-380"><a href="#L-380"><span class="linenos">380</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">normal</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">t_standard</span><span class="p">))</span>
-</span><span id="L-381"><a href="#L-381"><span class="linenos">381</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="p">(</span><span class="n">rand</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">rand</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">rand</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
-</span><span id="L-382"><a href="#L-382"><span class="linenos">382</span></a>
-</span><span id="L-383"><a href="#L-383"><span class="linenos">383</span></a>            <span class="n">M</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">t_standard</span><span class="p">,</span> <span class="n">rand</span><span class="p">))</span>
-</span><span id="L-384"><a href="#L-384"><span class="linenos">384</span></a>            <span class="n">M_centred</span> <span class="o">=</span> <span class="p">(</span><span class="n">M</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">M</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))</span>
-</span><span id="L-385"><a href="#L-385"><span class="linenos">385</span></a>
-</span><span id="L-386"><a href="#L-386"><span class="linenos">386</span></a>            <span class="n">Id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">eye</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">t</span><span class="p">))</span>
-</span><span id="L-387"><a href="#L-387"><span class="linenos">387</span></a>            <span class="n">Q</span> <span class="o">=</span> <span class="n">qr</span><span class="p">(</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="p">[</span><span class="mi">0</span><span class="p">]],</span> <span class="n">mode</span><span class="o">=</span><span class="s1">&#39;economic&#39;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="L-388"><a href="#L-388"><span class="linenos">388</span></a>            <span class="n">P</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Q</span><span class="p">,</span> <span class="n">Q</span><span class="o">.</span><span class="n">T</span><span class="p">)</span>
-</span><span id="L-389"><a href="#L-389"><span class="linenos">389</span></a>            <span class="n">orthogonal_projection</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Id</span> <span class="o">-</span> <span class="n">P</span><span class="p">,</span> <span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">])</span>
-</span><span id="L-390"><a href="#L-390"><span class="linenos">390</span></a>            <span class="n">M_orthogonal</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">],</span> <span class="n">orthogonal_projection</span><span class="p">))</span>
-</span><span id="L-391"><a href="#L-391"><span class="linenos">391</span></a>
-</span><span id="L-392"><a href="#L-392"><span class="linenos">392</span></a>            <span class="n">Y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">M_orthogonal</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">M_orthogonal</span> <span class="o">**</span> <span class="mi">2</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))))</span>
-</span><span id="L-393"><a href="#L-393"><span class="linenos">393</span></a>            <span class="n">corr</span> <span class="o">=</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">tan</span><span class="p">(</span><span class="n">theta</span><span class="p">))</span> <span class="o">*</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">]</span>
-</span><span id="L-394"><a href="#L-394"><span class="linenos">394</span></a>
-</span><span id="L-395"><a href="#L-395"><span class="linenos">395</span></a>            <span class="n">correlated_features</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">corr</span><span class="p">)</span>
+</span><span id="L-349"><a href="#L-349"><span class="linenos">349</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-350"><a href="#L-350"><span class="linenos">350</span></a>
+</span><span id="L-351"><a href="#L-351"><span class="linenos">351</span></a>    <span class="k">def</span> <span class="nf">generate_correlated</span><span class="p">(</span>
+</span><span id="L-352"><a href="#L-352"><span class="linenos">352</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-353"><a href="#L-353"><span class="linenos">353</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-354"><a href="#L-354"><span class="linenos">354</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-355"><a href="#L-355"><span class="linenos">355</span></a>        <span class="n">r</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.8</span><span class="p">,</span>
+</span><span id="L-356"><a href="#L-356"><span class="linenos">356</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-357"><a href="#L-357"><span class="linenos">357</span></a>
+</span><span id="L-358"><a href="#L-358"><span class="linenos">358</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-359"><a href="#L-359"><span class="linenos">359</span></a><span class="sd">        Generates correlated features using the given feature indices. Correlation is based on cosine of angle between vectors with mean 0.</span>
+</span><span id="L-360"><a href="#L-360"><span class="linenos">360</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="L-361"><a href="#L-361"><span class="linenos">361</span></a><span class="sd">        :param feature_indices: indices of features to generate correlated feature to</span>
+</span><span id="L-362"><a href="#L-362"><span class="linenos">362</span></a><span class="sd">        :param r: (Pearson) correlation factor</span>
+</span><span id="L-363"><a href="#L-363"><span class="linenos">363</span></a><span class="sd">        :return: X with generated correlated  features</span>
+</span><span id="L-364"><a href="#L-364"><span class="linenos">364</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-365"><a href="#L-365"><span class="linenos">365</span></a>
+</span><span id="L-366"><a href="#L-366"><span class="linenos">366</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="L-367"><a href="#L-367"><span class="linenos">367</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
+</span><span id="L-368"><a href="#L-368"><span class="linenos">368</span></a>
+</span><span id="L-369"><a href="#L-369"><span class="linenos">369</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="L-370"><a href="#L-370"><span class="linenos">370</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)),</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="L-371"><a href="#L-371"><span class="linenos">371</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-372"><a href="#L-372"><span class="linenos">372</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="L-373"><a href="#L-373"><span class="linenos">373</span></a>
+</span><span id="L-374"><a href="#L-374"><span class="linenos">374</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="L-375"><a href="#L-375"><span class="linenos">375</span></a>        <span class="n">transposed</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
+</span><span id="L-376"><a href="#L-376"><span class="linenos">376</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-377"><a href="#L-377"><span class="linenos">377</span></a>
+</span><span id="L-378"><a href="#L-378"><span class="linenos">378</span></a>        <span class="k">for</span> <span class="n">t</span> <span class="ow">in</span> <span class="n">transposed</span><span class="p">:</span>
+</span><span id="L-379"><a href="#L-379"><span class="linenos">379</span></a>            <span class="n">theta</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arccos</span><span class="p">(</span><span class="n">r</span><span class="p">)</span>
+</span><span id="L-380"><a href="#L-380"><span class="linenos">380</span></a>            <span class="n">t_standard</span> <span class="o">=</span> <span class="p">(</span><span class="n">t</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">t</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">t</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
+</span><span id="L-381"><a href="#L-381"><span class="linenos">381</span></a>
+</span><span id="L-382"><a href="#L-382"><span class="linenos">382</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">normal</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">t_standard</span><span class="p">))</span>
+</span><span id="L-383"><a href="#L-383"><span class="linenos">383</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="p">(</span><span class="n">rand</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">rand</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">rand</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
+</span><span id="L-384"><a href="#L-384"><span class="linenos">384</span></a>
+</span><span id="L-385"><a href="#L-385"><span class="linenos">385</span></a>            <span class="n">M</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">t_standard</span><span class="p">,</span> <span class="n">rand</span><span class="p">))</span>
+</span><span id="L-386"><a href="#L-386"><span class="linenos">386</span></a>            <span class="n">M_centred</span> <span class="o">=</span> <span class="p">(</span><span class="n">M</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">M</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))</span>
+</span><span id="L-387"><a href="#L-387"><span class="linenos">387</span></a>
+</span><span id="L-388"><a href="#L-388"><span class="linenos">388</span></a>            <span class="n">Id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">eye</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">t</span><span class="p">))</span>
+</span><span id="L-389"><a href="#L-389"><span class="linenos">389</span></a>            <span class="n">Q</span> <span class="o">=</span> <span class="n">qr</span><span class="p">(</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="p">[</span><span class="mi">0</span><span class="p">]],</span> <span class="n">mode</span><span class="o">=</span><span class="s1">&#39;economic&#39;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="L-390"><a href="#L-390"><span class="linenos">390</span></a>            <span class="n">P</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Q</span><span class="p">,</span> <span class="n">Q</span><span class="o">.</span><span class="n">T</span><span class="p">)</span>
+</span><span id="L-391"><a href="#L-391"><span class="linenos">391</span></a>            <span class="n">orthogonal_projection</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Id</span> <span class="o">-</span> <span class="n">P</span><span class="p">,</span> <span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">])</span>
+</span><span id="L-392"><a href="#L-392"><span class="linenos">392</span></a>            <span class="n">M_orthogonal</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">],</span> <span class="n">orthogonal_projection</span><span class="p">))</span>
+</span><span id="L-393"><a href="#L-393"><span class="linenos">393</span></a>
+</span><span id="L-394"><a href="#L-394"><span class="linenos">394</span></a>            <span class="n">Y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">M_orthogonal</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">M_orthogonal</span> <span class="o">**</span> <span class="mi">2</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))))</span>
+</span><span id="L-395"><a href="#L-395"><span class="linenos">395</span></a>            <span class="n">corr</span> <span class="o">=</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">tan</span><span class="p">(</span><span class="n">theta</span><span class="p">))</span> <span class="o">*</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">]</span>
 </span><span id="L-396"><a href="#L-396"><span class="linenos">396</span></a>
-</span><span id="L-397"><a href="#L-397"><span class="linenos">397</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">correlated_features</span><span class="p">)</span>
+</span><span id="L-397"><a href="#L-397"><span class="linenos">397</span></a>            <span class="n">correlated_features</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">corr</span><span class="p">)</span>
 </span><span id="L-398"><a href="#L-398"><span class="linenos">398</span></a>
-</span><span id="L-399"><a href="#L-399"><span class="linenos">399</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="L-400"><a href="#L-400"><span class="linenos">400</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
-</span><span id="L-401"><a href="#L-401"><span class="linenos">401</span></a>            <span class="s1">&#39;correlated_indices&#39;</span><span class="p">:</span> <span class="n">correlated_ixs</span><span class="p">,</span>
-</span><span id="L-402"><a href="#L-402"><span class="linenos">402</span></a>            <span class="s1">&#39;correlation_factor&#39;</span><span class="p">:</span> <span class="n">r</span><span class="p">,</span>
-</span><span id="L-403"><a href="#L-403"><span class="linenos">403</span></a>        <span class="p">})</span>
-</span><span id="L-404"><a href="#L-404"><span class="linenos">404</span></a>
-</span><span id="L-405"><a href="#L-405"><span class="linenos">405</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">correlated_features</span><span class="p">))</span>
+</span><span id="L-399"><a href="#L-399"><span class="linenos">399</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">correlated_features</span><span class="p">)</span>
+</span><span id="L-400"><a href="#L-400"><span class="linenos">400</span></a>
+</span><span id="L-401"><a href="#L-401"><span class="linenos">401</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="L-402"><a href="#L-402"><span class="linenos">402</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="L-403"><a href="#L-403"><span class="linenos">403</span></a>            <span class="s1">&#39;correlated_indices&#39;</span><span class="p">:</span> <span class="n">correlated_ixs</span><span class="p">,</span>
+</span><span id="L-404"><a href="#L-404"><span class="linenos">404</span></a>            <span class="s1">&#39;correlation_factor&#39;</span><span class="p">:</span> <span class="n">r</span><span class="p">,</span>
+</span><span id="L-405"><a href="#L-405"><span class="linenos">405</span></a>        <span class="p">})</span>
 </span><span id="L-406"><a href="#L-406"><span class="linenos">406</span></a>
-</span><span id="L-407"><a href="#L-407"><span class="linenos">407</span></a>    <span class="k">def</span> <span class="nf">generate_duplicates</span><span class="p">(</span>
-</span><span id="L-408"><a href="#L-408"><span class="linenos">408</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="L-409"><a href="#L-409"><span class="linenos">409</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="L-410"><a href="#L-410"><span class="linenos">410</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="L-411"><a href="#L-411"><span class="linenos">411</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="L-412"><a href="#L-412"><span class="linenos">412</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="L-413"><a href="#L-413"><span class="linenos">413</span></a><span class="sd">        Generates duplicate features</span>
-</span><span id="L-414"><a href="#L-414"><span class="linenos">414</span></a><span class="sd">        :param X: dataset</span>
-</span><span id="L-415"><a href="#L-415"><span class="linenos">415</span></a><span class="sd">        :param feature_indices: indices of features to duplicate</span>
-</span><span id="L-416"><a href="#L-416"><span class="linenos">416</span></a><span class="sd">        :return: dataset with duplicated features</span>
-</span><span id="L-417"><a href="#L-417"><span class="linenos">417</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-418"><a href="#L-418"><span class="linenos">418</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="L-419"><a href="#L-419"><span class="linenos">419</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
-</span><span id="L-420"><a href="#L-420"><span class="linenos">420</span></a>
-</span><span id="L-421"><a href="#L-421"><span class="linenos">421</span></a>        <span class="n">duplicated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">),</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="L-407"><a href="#L-407"><span class="linenos">407</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">correlated_features</span><span class="p">))</span>
+</span><span id="L-408"><a href="#L-408"><span class="linenos">408</span></a>
+</span><span id="L-409"><a href="#L-409"><span class="linenos">409</span></a>    <span class="k">def</span> <span class="nf">generate_duplicates</span><span class="p">(</span>
+</span><span id="L-410"><a href="#L-410"><span class="linenos">410</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-411"><a href="#L-411"><span class="linenos">411</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-412"><a href="#L-412"><span class="linenos">412</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-413"><a href="#L-413"><span class="linenos">413</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-414"><a href="#L-414"><span class="linenos">414</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-415"><a href="#L-415"><span class="linenos">415</span></a><span class="sd">        Generates duplicate features</span>
+</span><span id="L-416"><a href="#L-416"><span class="linenos">416</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="L-417"><a href="#L-417"><span class="linenos">417</span></a><span class="sd">        :param feature_indices: indices of features to duplicate</span>
+</span><span id="L-418"><a href="#L-418"><span class="linenos">418</span></a><span class="sd">        :return: dataset with duplicated features</span>
+</span><span id="L-419"><a href="#L-419"><span class="linenos">419</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-420"><a href="#L-420"><span class="linenos">420</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="L-421"><a href="#L-421"><span class="linenos">421</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
 </span><span id="L-422"><a href="#L-422"><span class="linenos">422</span></a>
-</span><span id="L-423"><a href="#L-423"><span class="linenos">423</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="L-423"><a href="#L-423"><span class="linenos">423</span></a>        <span class="n">duplicated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">),</span> <span class="mi">1</span><span class="p">)</span>
 </span><span id="L-424"><a href="#L-424"><span class="linenos">424</span></a>
-</span><span id="L-425"><a href="#L-425"><span class="linenos">425</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="L-426"><a href="#L-426"><span class="linenos">426</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
-</span><span id="L-427"><a href="#L-427"><span class="linenos">427</span></a>            <span class="s1">&#39;duplicate_indices&#39;</span><span class="p">:</span> <span class="n">duplicated_ixs</span><span class="p">,</span>
-</span><span id="L-428"><a href="#L-428"><span class="linenos">428</span></a>        <span class="p">})</span>
-</span><span id="L-429"><a href="#L-429"><span class="linenos">429</span></a>
-</span><span id="L-430"><a href="#L-430"><span class="linenos">430</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">selected_features</span><span class="p">))</span>
+</span><span id="L-425"><a href="#L-425"><span class="linenos">425</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="L-426"><a href="#L-426"><span class="linenos">426</span></a>
+</span><span id="L-427"><a href="#L-427"><span class="linenos">427</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="L-428"><a href="#L-428"><span class="linenos">428</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="L-429"><a href="#L-429"><span class="linenos">429</span></a>            <span class="s1">&#39;duplicate_indices&#39;</span><span class="p">:</span> <span class="n">duplicated_ixs</span><span class="p">,</span>
+</span><span id="L-430"><a href="#L-430"><span class="linenos">430</span></a>        <span class="p">})</span>
 </span><span id="L-431"><a href="#L-431"><span class="linenos">431</span></a>
-</span><span id="L-432"><a href="#L-432"><span class="linenos">432</span></a>    <span class="k">def</span> <span class="nf">generate_labels</span><span class="p">(</span>
-</span><span id="L-433"><a href="#L-433"><span class="linenos">433</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="L-434"><a href="#L-434"><span class="linenos">434</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="L-435"><a href="#L-435"><span class="linenos">435</span></a>        <span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
-</span><span id="L-436"><a href="#L-436"><span class="linenos">436</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">|</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">=</span> <span class="mf">0.5</span><span class="p">,</span>
-</span><span id="L-437"><a href="#L-437"><span class="linenos">437</span></a>        <span class="n">k</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
-</span><span id="L-438"><a href="#L-438"><span class="linenos">438</span></a>        <span class="n">decision_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="L-439"><a href="#L-439"><span class="linenos">439</span></a>        <span class="n">class_relation</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
-</span><span id="L-440"><a href="#L-440"><span class="linenos">440</span></a>        <span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="L-441"><a href="#L-441"><span class="linenos">441</span></a>    <span class="p">):</span>
-</span><span id="L-442"><a href="#L-442"><span class="linenos">442</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="L-443"><a href="#L-443"><span class="linenos">443</span></a><span class="sd">        Generates labels for dataset X</span>
-</span><span id="L-444"><a href="#L-444"><span class="linenos">444</span></a><span class="sd">        :param X: dataset</span>
-</span><span id="L-445"><a href="#L-445"><span class="linenos">445</span></a><span class="sd">        :param n: number of class labels</span>
-</span><span id="L-446"><a href="#L-446"><span class="linenos">446</span></a><span class="sd">        :param p: class distribution</span>
-</span><span id="L-447"><a href="#L-447"><span class="linenos">447</span></a><span class="sd">        :param k: constant</span>
-</span><span id="L-448"><a href="#L-448"><span class="linenos">448</span></a><span class="sd">        :param decision_function: optional user-defined decision function</span>
-</span><span id="L-449"><a href="#L-449"><span class="linenos">449</span></a><span class="sd">        :param class_relation: string, either &#39;linear&#39;, &#39;nonlinear&#39;, or &#39;cluster&#39;</span>
-</span><span id="L-450"><a href="#L-450"><span class="linenos">450</span></a><span class="sd">        :param balance: boolean, whether to balance clustering class labels</span>
-</span><span id="L-451"><a href="#L-451"><span class="linenos">451</span></a><span class="sd">        :return: array of labels, corresponding to dataset X</span>
-</span><span id="L-452"><a href="#L-452"><span class="linenos">452</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-453"><a href="#L-453"><span class="linenos">453</span></a>
-</span><span id="L-454"><a href="#L-454"><span class="linenos">454</span></a>        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="L-455"><a href="#L-455"><span class="linenos">455</span></a>            <span class="k">if</span> <span class="nb">sum</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;sum of values in must be less than 1.0&#39;</span><span class="p">)</span>
-</span><span id="L-456"><a href="#L-456"><span class="linenos">456</span></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">n</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;length of p must equal n&#39;</span><span class="p">)</span>
+</span><span id="L-432"><a href="#L-432"><span class="linenos">432</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">selected_features</span><span class="p">))</span>
+</span><span id="L-433"><a href="#L-433"><span class="linenos">433</span></a>
+</span><span id="L-434"><a href="#L-434"><span class="linenos">434</span></a>    <span class="k">def</span> <span class="nf">generate_labels</span><span class="p">(</span>
+</span><span id="L-435"><a href="#L-435"><span class="linenos">435</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-436"><a href="#L-436"><span class="linenos">436</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-437"><a href="#L-437"><span class="linenos">437</span></a>        <span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
+</span><span id="L-438"><a href="#L-438"><span class="linenos">438</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">|</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">=</span> <span class="mf">0.5</span><span class="p">,</span>
+</span><span id="L-439"><a href="#L-439"><span class="linenos">439</span></a>        <span class="n">k</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
+</span><span id="L-440"><a href="#L-440"><span class="linenos">440</span></a>        <span class="n">decision_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-441"><a href="#L-441"><span class="linenos">441</span></a>        <span class="n">class_relation</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;linear&#39;</span><span class="p">,</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">,</span> <span class="s1">&#39;cluster&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
+</span><span id="L-442"><a href="#L-442"><span class="linenos">442</span></a>        <span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-443"><a href="#L-443"><span class="linenos">443</span></a>        <span class="n">random_state</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
+</span><span id="L-444"><a href="#L-444"><span class="linenos">444</span></a>    <span class="p">):</span>
+</span><span id="L-445"><a href="#L-445"><span class="linenos">445</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-446"><a href="#L-446"><span class="linenos">446</span></a><span class="sd">        Generates labels for dataset X</span>
+</span><span id="L-447"><a href="#L-447"><span class="linenos">447</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="L-448"><a href="#L-448"><span class="linenos">448</span></a><span class="sd">        :param n: number of class labels</span>
+</span><span id="L-449"><a href="#L-449"><span class="linenos">449</span></a><span class="sd">        :param p: class distribution</span>
+</span><span id="L-450"><a href="#L-450"><span class="linenos">450</span></a><span class="sd">        :param k: constant</span>
+</span><span id="L-451"><a href="#L-451"><span class="linenos">451</span></a><span class="sd">        :param decision_function: optional user-defined decision function</span>
+</span><span id="L-452"><a href="#L-452"><span class="linenos">452</span></a><span class="sd">        :param class_relation: string, either &#39;linear&#39;, &#39;nonlinear&#39;, or &#39;cluster&#39;</span>
+</span><span id="L-453"><a href="#L-453"><span class="linenos">453</span></a><span class="sd">        :param balance: boolean, whether to balance clustering class labels</span>
+</span><span id="L-454"><a href="#L-454"><span class="linenos">454</span></a><span class="sd">        :param random_state: seed for KMeans clustering, defaults to 42</span>
+</span><span id="L-455"><a href="#L-455"><span class="linenos">455</span></a><span class="sd">        :return: array of labels, corresponding to dataset X</span>
+</span><span id="L-456"><a href="#L-456"><span class="linenos">456</span></a><span class="sd">        &quot;&quot;&quot;</span>
 </span><span id="L-457"><a href="#L-457"><span class="linenos">457</span></a>
-</span><span id="L-458"><a href="#L-458"><span class="linenos">458</span></a>        <span class="k">if</span> <span class="n">p</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;p must be less than 1.0&#39;</span><span class="p">)</span>
-</span><span id="L-459"><a href="#L-459"><span class="linenos">459</span></a>
-</span><span id="L-460"><a href="#L-460"><span class="linenos">460</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="L-458"><a href="#L-458"><span class="linenos">458</span></a>        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="L-459"><a href="#L-459"><span class="linenos">459</span></a>            <span class="k">if</span> <span class="nb">sum</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;sum of values in must be less than 1.0&#39;</span><span class="p">)</span>
+</span><span id="L-460"><a href="#L-460"><span class="linenos">460</span></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">n</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;length of p must equal n&#39;</span><span class="p">)</span>
 </span><span id="L-461"><a href="#L-461"><span class="linenos">461</span></a>
-</span><span id="L-462"><a href="#L-462"><span class="linenos">462</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-463"><a href="#L-463"><span class="linenos">463</span></a>            <span class="k">if</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
-</span><span id="L-464"><a href="#L-464"><span class="linenos">464</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="n">x</span> <span class="o">+</span> <span class="mi">3</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="L-465"><a href="#L-465"><span class="linenos">465</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
-</span><span id="L-466"><a href="#L-466"><span class="linenos">466</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="o">+</span> <span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">cos</span><span class="p">(</span><span class="n">x</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="L-467"><a href="#L-467"><span class="linenos">467</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;cluster&#39;</span><span class="p">:</span>
-</span><span id="L-468"><a href="#L-468"><span class="linenos">468</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="L-469"><a href="#L-469"><span class="linenos">469</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-470"><a href="#L-470"><span class="linenos">470</span></a>            <span class="n">class_relation</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">decision_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
-</span><span id="L-471"><a href="#L-471"><span class="linenos">471</span></a>
-</span><span id="L-472"><a href="#L-472"><span class="linenos">472</span></a>        <span class="n">y</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-473"><a href="#L-473"><span class="linenos">473</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-474"><a href="#L-474"><span class="linenos">474</span></a>            <span class="k">if</span> <span class="n">n</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="L-475"><a href="#L-475"><span class="linenos">475</span></a>                <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">list</span><span class="p">:</span>
-</span><span id="L-476"><a href="#L-476"><span class="linenos">476</span></a>                    <span class="n">p</span> <span class="o">=</span> <span class="mi">1</span> <span class="o">/</span> <span class="n">n</span>
-</span><span id="L-477"><a href="#L-477"><span class="linenos">477</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">]</span>
-</span><span id="L-478"><a href="#L-478"><span class="linenos">478</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
-</span><span id="L-479"><a href="#L-479"><span class="linenos">479</span></a>                        <span class="n">percentiles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">))</span>
-</span><span id="L-480"><a href="#L-480"><span class="linenos">480</span></a>
-</span><span id="L-481"><a href="#L-481"><span class="linenos">481</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-</span><span id="L-482"><a href="#L-482"><span class="linenos">482</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
-</span><span id="L-483"><a href="#L-483"><span class="linenos">483</span></a>
-</span><span id="L-484"><a href="#L-484"><span class="linenos">484</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
-</span><span id="L-485"><a href="#L-485"><span class="linenos">485</span></a>                    <span class="k">for</span> <span class="n">p_point</span> <span class="ow">in</span> <span class="n">p_points</span><span class="p">:</span>
-</span><span id="L-486"><a href="#L-486"><span class="linenos">486</span></a>                        <span class="n">y</span> <span class="o">+=</span> <span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">)</span>
-</span><span id="L-487"><a href="#L-487"><span class="linenos">487</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="L-488"><a href="#L-488"><span class="linenos">488</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-</span><span id="L-489"><a href="#L-489"><span class="linenos">489</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="o">*</span> <span class="mi">100</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">p</span><span class="p">]</span>
-</span><span id="L-490"><a href="#L-490"><span class="linenos">490</span></a>
-</span><span id="L-491"><a href="#L-491"><span class="linenos">491</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
-</span><span id="L-492"><a href="#L-492"><span class="linenos">492</span></a>                        <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">+=</span> <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span>
-</span><span id="L-493"><a href="#L-493"><span class="linenos">493</span></a>
-</span><span id="L-494"><a href="#L-494"><span class="linenos">494</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">insert</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
-</span><span id="L-495"><a href="#L-495"><span class="linenos">495</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">pop</span><span class="p">()</span>
-</span><span id="L-496"><a href="#L-496"><span class="linenos">496</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span>
+</span><span id="L-462"><a href="#L-462"><span class="linenos">462</span></a>        <span class="k">if</span> <span class="n">p</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;p must be less than 1.0&#39;</span><span class="p">)</span>
+</span><span id="L-463"><a href="#L-463"><span class="linenos">463</span></a>
+</span><span id="L-464"><a href="#L-464"><span class="linenos">464</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="L-465"><a href="#L-465"><span class="linenos">465</span></a>
+</span><span id="L-466"><a href="#L-466"><span class="linenos">466</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-467"><a href="#L-467"><span class="linenos">467</span></a>            <span class="k">if</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
+</span><span id="L-468"><a href="#L-468"><span class="linenos">468</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="n">x</span> <span class="o">+</span> <span class="mi">3</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-469"><a href="#L-469"><span class="linenos">469</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
+</span><span id="L-470"><a href="#L-470"><span class="linenos">470</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="o">+</span> <span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">cos</span><span class="p">(</span><span class="n">x</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-471"><a href="#L-471"><span class="linenos">471</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;cluster&#39;</span><span class="p">:</span>
+</span><span id="L-472"><a href="#L-472"><span class="linenos">472</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="L-473"><a href="#L-473"><span class="linenos">473</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-474"><a href="#L-474"><span class="linenos">474</span></a>            <span class="n">class_relation</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">decision_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
+</span><span id="L-475"><a href="#L-475"><span class="linenos">475</span></a>
+</span><span id="L-476"><a href="#L-476"><span class="linenos">476</span></a>        <span class="n">y</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-477"><a href="#L-477"><span class="linenos">477</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-478"><a href="#L-478"><span class="linenos">478</span></a>            <span class="k">if</span> <span class="n">n</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="L-479"><a href="#L-479"><span class="linenos">479</span></a>                <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">list</span><span class="p">:</span>
+</span><span id="L-480"><a href="#L-480"><span class="linenos">480</span></a>                    <span class="n">p</span> <span class="o">=</span> <span class="mi">1</span> <span class="o">/</span> <span class="n">n</span>
+</span><span id="L-481"><a href="#L-481"><span class="linenos">481</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">]</span>
+</span><span id="L-482"><a href="#L-482"><span class="linenos">482</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="L-483"><a href="#L-483"><span class="linenos">483</span></a>                        <span class="n">percentiles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">))</span>
+</span><span id="L-484"><a href="#L-484"><span class="linenos">484</span></a>
+</span><span id="L-485"><a href="#L-485"><span class="linenos">485</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="L-486"><a href="#L-486"><span class="linenos">486</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
+</span><span id="L-487"><a href="#L-487"><span class="linenos">487</span></a>
+</span><span id="L-488"><a href="#L-488"><span class="linenos">488</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="L-489"><a href="#L-489"><span class="linenos">489</span></a>                    <span class="k">for</span> <span class="n">p_point</span> <span class="ow">in</span> <span class="n">p_points</span><span class="p">:</span>
+</span><span id="L-490"><a href="#L-490"><span class="linenos">490</span></a>                        <span class="n">y</span> <span class="o">+=</span> <span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">)</span>
+</span><span id="L-491"><a href="#L-491"><span class="linenos">491</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="L-492"><a href="#L-492"><span class="linenos">492</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="L-493"><a href="#L-493"><span class="linenos">493</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="o">*</span> <span class="mi">100</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">p</span><span class="p">]</span>
+</span><span id="L-494"><a href="#L-494"><span class="linenos">494</span></a>
+</span><span id="L-495"><a href="#L-495"><span class="linenos">495</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="L-496"><a href="#L-496"><span class="linenos">496</span></a>                        <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">+=</span> <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span>
 </span><span id="L-497"><a href="#L-497"><span class="linenos">497</span></a>
-</span><span id="L-498"><a href="#L-498"><span class="linenos">498</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
-</span><span id="L-499"><a href="#L-499"><span class="linenos">499</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">p_points</span><span class="p">)</span>
-</span><span id="L-500"><a href="#L-500"><span class="linenos">500</span></a>
-</span><span id="L-501"><a href="#L-501"><span class="linenos">501</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
-</span><span id="L-502"><a href="#L-502"><span class="linenos">502</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span><span class="p">):</span>
-</span><span id="L-503"><a href="#L-503"><span class="linenos">503</span></a>                        <span class="n">p_point</span> <span class="o">=</span> <span class="n">p_points</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
-</span><span id="L-504"><a href="#L-504"><span class="linenos">504</span></a>                        <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">)):</span>
-</span><span id="L-505"><a href="#L-505"><span class="linenos">505</span></a>                            <span class="k">if</span> <span class="n">decision_boundary</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">:</span>
-</span><span id="L-506"><a href="#L-506"><span class="linenos">506</span></a>                                <span class="n">y</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="L-507"><a href="#L-507"><span class="linenos">507</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="L-508"><a href="#L-508"><span class="linenos">508</span></a>                <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-</span><span id="L-509"><a href="#L-509"><span class="linenos">509</span></a>                <span class="n">p_point</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">)</span>
-</span><span id="L-510"><a href="#L-510"><span class="linenos">510</span></a>                <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
-</span><span id="L-511"><a href="#L-511"><span class="linenos">511</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-512"><a href="#L-512"><span class="linenos">512</span></a>            <span class="k">if</span> <span class="n">p</span> <span class="o">==</span> <span class="mf">0.5</span><span class="p">:</span>
-</span><span id="L-513"><a href="#L-513"><span class="linenos">513</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="mf">1.0</span>
-</span><span id="L-514"><a href="#L-514"><span class="linenos">514</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="L-515"><a href="#L-515"><span class="linenos">515</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span><span class="p">,</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">p</span><span class="p">]</span>
-</span><span id="L-516"><a href="#L-516"><span class="linenos">516</span></a>            <span class="n">y</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_cluster_data</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">n</span><span class="p">,</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">,</span> <span class="n">balance</span><span class="o">=</span><span class="n">balance</span><span class="p">)</span>
-</span><span id="L-517"><a href="#L-517"><span class="linenos">517</span></a>
-</span><span id="L-518"><a href="#L-518"><span class="linenos">518</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
-</span><span id="L-519"><a href="#L-519"><span class="linenos">519</span></a>            <span class="s1">&#39;labels&#39;</span><span class="p">:</span> <span class="p">{</span>
-</span><span id="L-520"><a href="#L-520"><span class="linenos">520</span></a>                <span class="s1">&#39;class_relation&#39;</span><span class="p">:</span> <span class="n">class_relation</span><span class="p">,</span>
-</span><span id="L-521"><a href="#L-521"><span class="linenos">521</span></a>                <span class="s1">&#39;n_class&#39;</span><span class="p">:</span> <span class="n">n</span><span class="p">,</span>
-</span><span id="L-522"><a href="#L-522"><span class="linenos">522</span></a>            <span class="p">},</span>
-</span><span id="L-523"><a href="#L-523"><span class="linenos">523</span></a>        <span class="p">})</span>
-</span><span id="L-524"><a href="#L-524"><span class="linenos">524</span></a>
-</span><span id="L-525"><a href="#L-525"><span class="linenos">525</span></a>        <span class="k">return</span> <span class="n">y</span>
-</span><span id="L-526"><a href="#L-526"><span class="linenos">526</span></a>
-</span><span id="L-527"><a href="#L-527"><span class="linenos">527</span></a>    <span class="k">def</span> <span class="nf">_cluster_data</span><span class="p">(</span>
-</span><span id="L-528"><a href="#L-528"><span class="linenos">528</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="L-529"><a href="#L-529"><span class="linenos">529</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="L-530"><a href="#L-530"><span class="linenos">530</span></a>        <span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="L-531"><a href="#L-531"><span class="linenos">531</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">|</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mf">1.0</span><span class="p">,</span>
-</span><span id="L-532"><a href="#L-532"><span class="linenos">532</span></a>        <span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="L-533"><a href="#L-533"><span class="linenos">533</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="L-534"><a href="#L-534"><span class="linenos">534</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="L-535"><a href="#L-535"><span class="linenos">535</span></a><span class="sd">        Cluster data using kmeans</span>
-</span><span id="L-536"><a href="#L-536"><span class="linenos">536</span></a><span class="sd">        :param X: dataset</span>
-</span><span id="L-537"><a href="#L-537"><span class="linenos">537</span></a><span class="sd">        :param n: number of clusters</span>
-</span><span id="L-538"><a href="#L-538"><span class="linenos">538</span></a><span class="sd">        :param p: class distribution</span>
-</span><span id="L-539"><a href="#L-539"><span class="linenos">539</span></a><span class="sd">        :param balance: balance the clusters according to p</span>
-</span><span id="L-540"><a href="#L-540"><span class="linenos">540</span></a><span class="sd">        :return: array of labels, corresponding to dataset X</span>
-</span><span id="L-541"><a href="#L-541"><span class="linenos">541</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-542"><a href="#L-542"><span class="linenos">542</span></a>
-</span><span id="L-543"><a href="#L-543"><span class="linenos">543</span></a>        <span class="n">kmeans</span> <span class="o">=</span> <span class="n">KMeans</span><span class="p">(</span><span class="n">n_clusters</span><span class="o">=</span><span class="n">n</span><span class="p">)</span>
-</span><span id="L-544"><a href="#L-544"><span class="linenos">544</span></a>
-</span><span id="L-545"><a href="#L-545"><span class="linenos">545</span></a>        <span class="n">kmeans</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-</span><span id="L-546"><a href="#L-546"><span class="linenos">546</span></a>
-</span><span id="L-547"><a href="#L-547"><span class="linenos">547</span></a>        <span class="n">cluster_labels</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">labels_</span>
+</span><span id="L-498"><a href="#L-498"><span class="linenos">498</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">insert</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+</span><span id="L-499"><a href="#L-499"><span class="linenos">499</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">pop</span><span class="p">()</span>
+</span><span id="L-500"><a href="#L-500"><span class="linenos">500</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span>
+</span><span id="L-501"><a href="#L-501"><span class="linenos">501</span></a>
+</span><span id="L-502"><a href="#L-502"><span class="linenos">502</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
+</span><span id="L-503"><a href="#L-503"><span class="linenos">503</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">p_points</span><span class="p">)</span>
+</span><span id="L-504"><a href="#L-504"><span class="linenos">504</span></a>
+</span><span id="L-505"><a href="#L-505"><span class="linenos">505</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="L-506"><a href="#L-506"><span class="linenos">506</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span><span class="p">):</span>
+</span><span id="L-507"><a href="#L-507"><span class="linenos">507</span></a>                        <span class="n">p_point</span> <span class="o">=</span> <span class="n">p_points</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="L-508"><a href="#L-508"><span class="linenos">508</span></a>                        <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">)):</span>
+</span><span id="L-509"><a href="#L-509"><span class="linenos">509</span></a>                            <span class="k">if</span> <span class="n">decision_boundary</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">:</span>
+</span><span id="L-510"><a href="#L-510"><span class="linenos">510</span></a>                                <span class="n">y</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-511"><a href="#L-511"><span class="linenos">511</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="L-512"><a href="#L-512"><span class="linenos">512</span></a>                <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="L-513"><a href="#L-513"><span class="linenos">513</span></a>                <span class="n">p_point</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">)</span>
+</span><span id="L-514"><a href="#L-514"><span class="linenos">514</span></a>                <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+</span><span id="L-515"><a href="#L-515"><span class="linenos">515</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-516"><a href="#L-516"><span class="linenos">516</span></a>            <span class="k">if</span> <span class="n">p</span> <span class="o">==</span> <span class="mf">0.5</span><span class="p">:</span>
+</span><span id="L-517"><a href="#L-517"><span class="linenos">517</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="mf">1.0</span>
+</span><span id="L-518"><a href="#L-518"><span class="linenos">518</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="L-519"><a href="#L-519"><span class="linenos">519</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span><span class="p">,</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">p</span><span class="p">]</span>
+</span><span id="L-520"><a href="#L-520"><span class="linenos">520</span></a>            <span class="n">y</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_cluster_data</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">n</span><span class="p">,</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">,</span> <span class="n">balance</span><span class="o">=</span><span class="n">balance</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="n">random_state</span><span class="p">)</span>
+</span><span id="L-521"><a href="#L-521"><span class="linenos">521</span></a>
+</span><span id="L-522"><a href="#L-522"><span class="linenos">522</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="L-523"><a href="#L-523"><span class="linenos">523</span></a>            <span class="s1">&#39;labels&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="L-524"><a href="#L-524"><span class="linenos">524</span></a>                <span class="s1">&#39;class_relation&#39;</span><span class="p">:</span> <span class="n">class_relation</span><span class="p">,</span>
+</span><span id="L-525"><a href="#L-525"><span class="linenos">525</span></a>                <span class="s1">&#39;n_class&#39;</span><span class="p">:</span> <span class="n">n</span><span class="p">,</span>
+</span><span id="L-526"><a href="#L-526"><span class="linenos">526</span></a>            <span class="p">},</span>
+</span><span id="L-527"><a href="#L-527"><span class="linenos">527</span></a>        <span class="p">})</span>
+</span><span id="L-528"><a href="#L-528"><span class="linenos">528</span></a>
+</span><span id="L-529"><a href="#L-529"><span class="linenos">529</span></a>        <span class="k">return</span> <span class="n">y</span>
+</span><span id="L-530"><a href="#L-530"><span class="linenos">530</span></a>
+</span><span id="L-531"><a href="#L-531"><span class="linenos">531</span></a>    <span class="k">def</span> <span class="nf">_cluster_data</span><span class="p">(</span>
+</span><span id="L-532"><a href="#L-532"><span class="linenos">532</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-533"><a href="#L-533"><span class="linenos">533</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-534"><a href="#L-534"><span class="linenos">534</span></a>        <span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-535"><a href="#L-535"><span class="linenos">535</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">|</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mf">1.0</span><span class="p">,</span>
+</span><span id="L-536"><a href="#L-536"><span class="linenos">536</span></a>        <span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-537"><a href="#L-537"><span class="linenos">537</span></a>        <span class="n">random_state</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
+</span><span id="L-538"><a href="#L-538"><span class="linenos">538</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-539"><a href="#L-539"><span class="linenos">539</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-540"><a href="#L-540"><span class="linenos">540</span></a><span class="sd">        Cluster data using kmeans</span>
+</span><span id="L-541"><a href="#L-541"><span class="linenos">541</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="L-542"><a href="#L-542"><span class="linenos">542</span></a><span class="sd">        :param n: number of clusters</span>
+</span><span id="L-543"><a href="#L-543"><span class="linenos">543</span></a><span class="sd">        :param p: class distribution</span>
+</span><span id="L-544"><a href="#L-544"><span class="linenos">544</span></a><span class="sd">        :param balance: balance the clusters according to p</span>
+</span><span id="L-545"><a href="#L-545"><span class="linenos">545</span></a><span class="sd">        :random_state: seed for KMeans clustering, defaults to 42</span>
+</span><span id="L-546"><a href="#L-546"><span class="linenos">546</span></a><span class="sd">        :return: array of labels, corresponding to dataset X</span>
+</span><span id="L-547"><a href="#L-547"><span class="linenos">547</span></a><span class="sd">        &quot;&quot;&quot;</span>
 </span><span id="L-548"><a href="#L-548"><span class="linenos">548</span></a>
-</span><span id="L-549"><a href="#L-549"><span class="linenos">549</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>  <span class="c1"># Fully balanced clusters</span>
-</span><span id="L-550"><a href="#L-550"><span class="linenos">550</span></a>            <span class="n">samples_per_cluster</span> <span class="o">=</span> <span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">)</span> <span class="o">//</span> <span class="n">n</span><span class="p">]</span> <span class="o">*</span> <span class="n">n</span>
-</span><span id="L-551"><a href="#L-551"><span class="linenos">551</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-552"><a href="#L-552"><span class="linenos">552</span></a>            <span class="n">samples</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-</span><span id="L-553"><a href="#L-553"><span class="linenos">553</span></a>            <span class="n">samples_per_cluster</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-554"><a href="#L-554"><span class="linenos">554</span></a>            <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="L-555"><a href="#L-555"><span class="linenos">555</span></a>                <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span> <span class="o">//</span> <span class="n">n</span><span class="p">)</span>
-</span><span id="L-556"><a href="#L-556"><span class="linenos">556</span></a>                <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="p">(</span><span class="mi">1</span> <span class="o">-</span> <span class="n">p</span><span class="p">))</span> <span class="o">//</span> <span class="n">n</span><span class="p">)</span>
-</span><span id="L-557"><a href="#L-557"><span class="linenos">557</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="L-558"><a href="#L-558"><span class="linenos">558</span></a>                <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">==</span> <span class="n">n</span><span class="p">:</span>
-</span><span id="L-559"><a href="#L-559"><span class="linenos">559</span></a>                    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">p</span><span class="p">:</span>
-</span><span id="L-560"><a href="#L-560"><span class="linenos">560</span></a>                        <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="n">val</span><span class="p">))</span>
-</span><span id="L-561"><a href="#L-561"><span class="linenos">561</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="L-562"><a href="#L-562"><span class="linenos">562</span></a>                    <span class="k">raise</span> <span class="ne">Exception</span><span class="p">(</span><span class="s1">&#39;Length of balance parameter must equal number of clusters.&#39;</span><span class="p">)</span>
-</span><span id="L-563"><a href="#L-563"><span class="linenos">563</span></a>
-</span><span id="L-564"><a href="#L-564"><span class="linenos">564</span></a>        <span class="c1"># Adjust cluster sizes</span>
-</span><span id="L-565"><a href="#L-565"><span class="linenos">565</span></a>        <span class="k">if</span> <span class="n">balance</span><span class="p">:</span>
-</span><span id="L-566"><a href="#L-566"><span class="linenos">566</span></a>            <span class="n">adjustments</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-567"><a href="#L-567"><span class="linenos">567</span></a>            <span class="n">overflow_samples</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-568"><a href="#L-568"><span class="linenos">568</span></a>            <span class="n">overflow_indices</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-569"><a href="#L-569"><span class="linenos">569</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">):</span>
-</span><span id="L-570"><a href="#L-570"><span class="linenos">570</span></a>                <span class="n">cluster_size</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">cluster_labels</span> <span class="o">==</span> <span class="n">i</span><span class="p">)</span>
-</span><span id="L-571"><a href="#L-571"><span class="linenos">571</span></a>
-</span><span id="L-572"><a href="#L-572"><span class="linenos">572</span></a>                <span class="n">adjustment</span> <span class="o">=</span> <span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">-</span> <span class="n">cluster_size</span>
-</span><span id="L-573"><a href="#L-573"><span class="linenos">573</span></a>                <span class="n">adjustments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">adjustment</span><span class="p">)</span>
-</span><span id="L-574"><a href="#L-574"><span class="linenos">574</span></a>
-</span><span id="L-575"><a href="#L-575"><span class="linenos">575</span></a>                <span class="k">if</span> <span class="n">adjustment</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">:</span>  <span class="c1"># Cluter is too large</span>
-</span><span id="L-576"><a href="#L-576"><span class="linenos">576</span></a>
-</span><span id="L-577"><a href="#L-577"><span class="linenos">577</span></a>                    <span class="n">centroid</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">cluster_centers_</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
-</span><span id="L-578"><a href="#L-578"><span class="linenos">578</span></a>                    <span class="n">dataset_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">cluster_labels</span> <span class="o">==</span> <span class="n">i</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>  <span class="c1"># Indices of samples in dataset</span>
-</span><span id="L-579"><a href="#L-579"><span class="linenos">579</span></a>                    <span class="n">cluster_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="n">dataset_indices</span><span class="p">])</span>
-</span><span id="L-580"><a href="#L-580"><span class="linenos">580</span></a>
-</span><span id="L-581"><a href="#L-581"><span class="linenos">581</span></a>                    <span class="n">distances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">linalg</span><span class="o">.</span><span class="n">norm</span><span class="p">(</span>
-</span><span id="L-582"><a href="#L-582"><span class="linenos">582</span></a>                        <span class="n">cluster_samples</span> <span class="o">-</span> <span class="n">centroid</span><span class="p">,</span>
-</span><span id="L-583"><a href="#L-583"><span class="linenos">583</span></a>                        <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="L-584"><a href="#L-584"><span class="linenos">584</span></a>                    <span class="p">)</span>  <span class="c1"># Distances of cluster samples to cluster centroid</span>
-</span><span id="L-585"><a href="#L-585"><span class="linenos">585</span></a>                    <span class="n">cluster_sample_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">distances</span><span class="p">)</span>
-</span><span id="L-586"><a href="#L-586"><span class="linenos">586</span></a>                    <span class="n">dataset_indices_sorted</span> <span class="o">=</span> <span class="n">dataset_indices</span><span class="p">[</span>
-</span><span id="L-587"><a href="#L-587"><span class="linenos">587</span></a>                        <span class="n">cluster_sample_indices</span>
-</span><span id="L-588"><a href="#L-588"><span class="linenos">588</span></a>                    <span class="p">]</span>  <span class="c1"># Indices of samples sorted by sample distance to cluster centroid</span>
-</span><span id="L-589"><a href="#L-589"><span class="linenos">589</span></a>
-</span><span id="L-590"><a href="#L-590"><span class="linenos">590</span></a>                    <span class="n">overflow_sample_indices</span> <span class="o">=</span> <span class="n">cluster_sample_indices</span><span class="p">[</span><span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]:]</span>  <span class="c1"># Overflow samples</span>
-</span><span id="L-591"><a href="#L-591"><span class="linenos">591</span></a>                    <span class="n">dataset_indices_sorted</span> <span class="o">=</span> <span class="n">dataset_indices_sorted</span><span class="p">[</span>
-</span><span id="L-592"><a href="#L-592"><span class="linenos">592</span></a>                                             <span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]:</span>
-</span><span id="L-593"><a href="#L-593"><span class="linenos">593</span></a>                    <span class="p">]</span>  <span class="c1"># Dataset indices of overflow samples</span>
-</span><span id="L-594"><a href="#L-594"><span class="linenos">594</span></a>
-</span><span id="L-595"><a href="#L-595"><span class="linenos">595</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">overflow_sample_indices</span><span class="p">)):</span>
-</span><span id="L-596"><a href="#L-596"><span class="linenos">596</span></a>                        <span class="n">overflow_samples</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster_samples</span><span class="p">[</span><span class="n">overflow_sample_indices</span><span class="p">[</span><span class="n">i</span><span class="p">]])</span>
-</span><span id="L-597"><a href="#L-597"><span class="linenos">597</span></a>                        <span class="n">overflow_indices</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">dataset_indices_sorted</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
-</span><span id="L-598"><a href="#L-598"><span class="linenos">598</span></a>
-</span><span id="L-599"><a href="#L-599"><span class="linenos">599</span></a>            <span class="n">overflow_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">overflow_samples</span><span class="p">)</span>
-</span><span id="L-600"><a href="#L-600"><span class="linenos">600</span></a>            <span class="n">overflow_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">overflow_indices</span><span class="p">)</span>
-</span><span id="L-601"><a href="#L-601"><span class="linenos">601</span></a>
-</span><span id="L-602"><a href="#L-602"><span class="linenos">602</span></a>            <span class="c1"># Making adjustments</span>
-</span><span id="L-603"><a href="#L-603"><span class="linenos">603</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">):</span>
-</span><span id="L-604"><a href="#L-604"><span class="linenos">604</span></a>
-</span><span id="L-605"><a href="#L-605"><span class="linenos">605</span></a>                <span class="k">if</span> <span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="L-606"><a href="#L-606"><span class="linenos">606</span></a>                    <span class="n">centroid</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">cluster_centers_</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
-</span><span id="L-607"><a href="#L-607"><span class="linenos">607</span></a>                    <span class="n">distances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">linalg</span><span class="o">.</span><span class="n">norm</span><span class="p">(</span><span class="n">overflow_samples</span> <span class="o">-</span> <span class="n">centroid</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="L-608"><a href="#L-608"><span class="linenos">608</span></a>
-</span><span id="L-609"><a href="#L-609"><span class="linenos">609</span></a>                    <span class="n">closest_sample_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">distances</span><span class="p">)</span>
-</span><span id="L-610"><a href="#L-610"><span class="linenos">610</span></a>
-</span><span id="L-611"><a href="#L-611"><span class="linenos">611</span></a>                    <span class="n">overflow_indices_sorted</span> <span class="o">=</span> <span class="n">overflow_indices</span><span class="p">[</span><span class="n">closest_sample_indices</span><span class="p">]</span>
+</span><span id="L-549"><a href="#L-549"><span class="linenos">549</span></a>        <span class="n">kmeans</span> <span class="o">=</span> <span class="n">KMeans</span><span class="p">(</span><span class="n">n_clusters</span><span class="o">=</span><span class="n">n</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="n">random_state</span><span class="p">)</span>
+</span><span id="L-550"><a href="#L-550"><span class="linenos">550</span></a>
+</span><span id="L-551"><a href="#L-551"><span class="linenos">551</span></a>        <span class="n">kmeans</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="L-552"><a href="#L-552"><span class="linenos">552</span></a>
+</span><span id="L-553"><a href="#L-553"><span class="linenos">553</span></a>        <span class="n">cluster_labels</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">labels_</span>
+</span><span id="L-554"><a href="#L-554"><span class="linenos">554</span></a>
+</span><span id="L-555"><a href="#L-555"><span class="linenos">555</span></a>        <span class="c1"># Fully balanced clusters</span>
+</span><span id="L-556"><a href="#L-556"><span class="linenos">556</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="L-557"><a href="#L-557"><span class="linenos">557</span></a>            <span class="n">samples_per_cluster</span> <span class="o">=</span> <span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">)</span> <span class="o">//</span> <span class="n">n</span><span class="p">]</span> <span class="o">*</span> <span class="n">n</span>
+</span><span id="L-558"><a href="#L-558"><span class="linenos">558</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-559"><a href="#L-559"><span class="linenos">559</span></a>            <span class="n">samples</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="L-560"><a href="#L-560"><span class="linenos">560</span></a>            <span class="n">samples_per_cluster</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-561"><a href="#L-561"><span class="linenos">561</span></a>            <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="L-562"><a href="#L-562"><span class="linenos">562</span></a>                <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span> <span class="o">//</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="L-563"><a href="#L-563"><span class="linenos">563</span></a>                <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="p">(</span><span class="mi">1</span> <span class="o">-</span> <span class="n">p</span><span class="p">))</span> <span class="o">//</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="L-564"><a href="#L-564"><span class="linenos">564</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="L-565"><a href="#L-565"><span class="linenos">565</span></a>                <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">==</span> <span class="n">n</span><span class="p">:</span>
+</span><span id="L-566"><a href="#L-566"><span class="linenos">566</span></a>                    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">p</span><span class="p">:</span>
+</span><span id="L-567"><a href="#L-567"><span class="linenos">567</span></a>                        <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="n">val</span><span class="p">))</span>
+</span><span id="L-568"><a href="#L-568"><span class="linenos">568</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="L-569"><a href="#L-569"><span class="linenos">569</span></a>                    <span class="k">raise</span> <span class="ne">Exception</span><span class="p">(</span><span class="s1">&#39;Length of balance parameter must equal number of clusters.&#39;</span><span class="p">)</span>
+</span><span id="L-570"><a href="#L-570"><span class="linenos">570</span></a>
+</span><span id="L-571"><a href="#L-571"><span class="linenos">571</span></a>        <span class="c1"># Adjust cluster sizes</span>
+</span><span id="L-572"><a href="#L-572"><span class="linenos">572</span></a>        <span class="k">if</span> <span class="n">balance</span><span class="p">:</span>
+</span><span id="L-573"><a href="#L-573"><span class="linenos">573</span></a>            <span class="n">adjustments</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-574"><a href="#L-574"><span class="linenos">574</span></a>            <span class="n">overflow_samples</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-575"><a href="#L-575"><span class="linenos">575</span></a>            <span class="n">overflow_indices</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-576"><a href="#L-576"><span class="linenos">576</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">):</span>
+</span><span id="L-577"><a href="#L-577"><span class="linenos">577</span></a>                <span class="n">cluster_size</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">cluster_labels</span> <span class="o">==</span> <span class="n">i</span><span class="p">)</span>
+</span><span id="L-578"><a href="#L-578"><span class="linenos">578</span></a>
+</span><span id="L-579"><a href="#L-579"><span class="linenos">579</span></a>                <span class="n">adjustment</span> <span class="o">=</span> <span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">-</span> <span class="n">cluster_size</span>
+</span><span id="L-580"><a href="#L-580"><span class="linenos">580</span></a>                <span class="n">adjustments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">adjustment</span><span class="p">)</span>
+</span><span id="L-581"><a href="#L-581"><span class="linenos">581</span></a>
+</span><span id="L-582"><a href="#L-582"><span class="linenos">582</span></a>                <span class="c1"># Cluster is too large</span>
+</span><span id="L-583"><a href="#L-583"><span class="linenos">583</span></a>                <span class="k">if</span> <span class="n">adjustment</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-584"><a href="#L-584"><span class="linenos">584</span></a>                    <span class="n">centroid</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">cluster_centers_</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="L-585"><a href="#L-585"><span class="linenos">585</span></a>                    <span class="c1"># Indices of samples in dataset</span>
+</span><span id="L-586"><a href="#L-586"><span class="linenos">586</span></a>                    <span class="n">dataset_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">cluster_labels</span> <span class="o">==</span> <span class="n">i</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="L-587"><a href="#L-587"><span class="linenos">587</span></a>                    <span class="n">cluster_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="n">dataset_indices</span><span class="p">])</span>
+</span><span id="L-588"><a href="#L-588"><span class="linenos">588</span></a>
+</span><span id="L-589"><a href="#L-589"><span class="linenos">589</span></a>                    <span class="n">distances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">linalg</span><span class="o">.</span><span class="n">norm</span><span class="p">(</span>
+</span><span id="L-590"><a href="#L-590"><span class="linenos">590</span></a>                        <span class="n">cluster_samples</span> <span class="o">-</span> <span class="n">centroid</span><span class="p">,</span>
+</span><span id="L-591"><a href="#L-591"><span class="linenos">591</span></a>                        <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="L-592"><a href="#L-592"><span class="linenos">592</span></a>                    <span class="p">)</span>  <span class="c1"># Distances of cluster samples to cluster centroid</span>
+</span><span id="L-593"><a href="#L-593"><span class="linenos">593</span></a>                    <span class="n">cluster_sample_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">distances</span><span class="p">)</span>
+</span><span id="L-594"><a href="#L-594"><span class="linenos">594</span></a>                    <span class="n">dataset_indices_sorted</span> <span class="o">=</span> <span class="n">dataset_indices</span><span class="p">[</span>
+</span><span id="L-595"><a href="#L-595"><span class="linenos">595</span></a>                        <span class="n">cluster_sample_indices</span>
+</span><span id="L-596"><a href="#L-596"><span class="linenos">596</span></a>                    <span class="p">]</span>  <span class="c1"># Indices of samples sorted by sample distance to cluster centroid</span>
+</span><span id="L-597"><a href="#L-597"><span class="linenos">597</span></a>
+</span><span id="L-598"><a href="#L-598"><span class="linenos">598</span></a>                    <span class="n">overflow_sample_indices</span> <span class="o">=</span> <span class="n">cluster_sample_indices</span><span class="p">[</span><span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]:]</span>  <span class="c1"># Overflow samples</span>
+</span><span id="L-599"><a href="#L-599"><span class="linenos">599</span></a>                    <span class="n">dataset_indices_sorted</span> <span class="o">=</span> <span class="n">dataset_indices_sorted</span><span class="p">[</span>
+</span><span id="L-600"><a href="#L-600"><span class="linenos">600</span></a>                                             <span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]:</span>
+</span><span id="L-601"><a href="#L-601"><span class="linenos">601</span></a>                    <span class="p">]</span>  <span class="c1"># Dataset indices of overflow samples</span>
+</span><span id="L-602"><a href="#L-602"><span class="linenos">602</span></a>
+</span><span id="L-603"><a href="#L-603"><span class="linenos">603</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">overflow_sample_indices</span><span class="p">)):</span>
+</span><span id="L-604"><a href="#L-604"><span class="linenos">604</span></a>                        <span class="n">overflow_samples</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster_samples</span><span class="p">[</span><span class="n">overflow_sample_indices</span><span class="p">[</span><span class="n">i</span><span class="p">]])</span>
+</span><span id="L-605"><a href="#L-605"><span class="linenos">605</span></a>                        <span class="n">overflow_indices</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">dataset_indices_sorted</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
+</span><span id="L-606"><a href="#L-606"><span class="linenos">606</span></a>
+</span><span id="L-607"><a href="#L-607"><span class="linenos">607</span></a>            <span class="n">overflow_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">overflow_samples</span><span class="p">)</span>
+</span><span id="L-608"><a href="#L-608"><span class="linenos">608</span></a>            <span class="n">overflow_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">overflow_indices</span><span class="p">)</span>
+</span><span id="L-609"><a href="#L-609"><span class="linenos">609</span></a>
+</span><span id="L-610"><a href="#L-610"><span class="linenos">610</span></a>            <span class="c1"># Making adjustments</span>
+</span><span id="L-611"><a href="#L-611"><span class="linenos">611</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">):</span>
 </span><span id="L-612"><a href="#L-612"><span class="linenos">612</span></a>
-</span><span id="L-613"><a href="#L-613"><span class="linenos">613</span></a>                    <span class="n">sample_indices_slice</span> <span class="o">=</span> <span class="n">closest_sample_indices</span><span class="p">[:</span><span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span>
-</span><span id="L-614"><a href="#L-614"><span class="linenos">614</span></a>                    <span class="n">overflow_indices_slice</span> <span class="o">=</span> <span class="n">overflow_indices_sorted</span><span class="p">[:</span><span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span>
-</span><span id="L-615"><a href="#L-615"><span class="linenos">615</span></a>
-</span><span id="L-616"><a href="#L-616"><span class="linenos">616</span></a>                    <span class="n">cluster_labels</span><span class="p">[</span><span class="n">overflow_indices_slice</span><span class="p">]</span> <span class="o">=</span> <span class="n">i</span>
-</span><span id="L-617"><a href="#L-617"><span class="linenos">617</span></a>
-</span><span id="L-618"><a href="#L-618"><span class="linenos">618</span></a>                    <span class="n">overflow_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">delete</span><span class="p">(</span><span class="n">overflow_samples</span><span class="p">,</span> <span class="n">sample_indices_slice</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="L-619"><a href="#L-619"><span class="linenos">619</span></a>                    <span class="n">overflow_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">delete</span><span class="p">(</span><span class="n">overflow_indices</span><span class="p">,</span> <span class="n">sample_indices_slice</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="L-613"><a href="#L-613"><span class="linenos">613</span></a>                <span class="k">if</span> <span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-614"><a href="#L-614"><span class="linenos">614</span></a>                    <span class="n">centroid</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">cluster_centers_</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="L-615"><a href="#L-615"><span class="linenos">615</span></a>                    <span class="n">distances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">linalg</span><span class="o">.</span><span class="n">norm</span><span class="p">(</span><span class="n">overflow_samples</span> <span class="o">-</span> <span class="n">centroid</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-616"><a href="#L-616"><span class="linenos">616</span></a>
+</span><span id="L-617"><a href="#L-617"><span class="linenos">617</span></a>                    <span class="n">closest_sample_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">distances</span><span class="p">)</span>
+</span><span id="L-618"><a href="#L-618"><span class="linenos">618</span></a>
+</span><span id="L-619"><a href="#L-619"><span class="linenos">619</span></a>                    <span class="n">overflow_indices_sorted</span> <span class="o">=</span> <span class="n">overflow_indices</span><span class="p">[</span><span class="n">closest_sample_indices</span><span class="p">]</span>
 </span><span id="L-620"><a href="#L-620"><span class="linenos">620</span></a>
-</span><span id="L-621"><a href="#L-621"><span class="linenos">621</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">cluster_labels</span><span class="p">)</span>
-</span><span id="L-622"><a href="#L-622"><span class="linenos">622</span></a>
-</span><span id="L-623"><a href="#L-623"><span class="linenos">623</span></a>    <span class="k">def</span> <span class="nf">generate_noise</span><span class="p">(</span>
-</span><span id="L-624"><a href="#L-624"><span class="linenos">624</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="L-625"><a href="#L-625"><span class="linenos">625</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="L-626"><a href="#L-626"><span class="linenos">626</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="L-627"><a href="#L-627"><span class="linenos">627</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.2</span><span class="p">,</span>
-</span><span id="L-628"><a href="#L-628"><span class="linenos">628</span></a>        <span class="nb">type</span><span class="p">:</span> <span class="n">Literal</span> <span class="o">=</span> <span class="s1">&#39;categorical&#39;</span><span class="p">,</span>
-</span><span id="L-629"><a href="#L-629"><span class="linenos">629</span></a>        <span class="n">missing_val</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;-inf&#39;</span><span class="p">),</span>
-</span><span id="L-630"><a href="#L-630"><span class="linenos">630</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="L-631"><a href="#L-631"><span class="linenos">631</span></a>
-</span><span id="L-632"><a href="#L-632"><span class="linenos">632</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="L-633"><a href="#L-633"><span class="linenos">633</span></a><span class="sd">        Simulates noise on given dataset X</span>
-</span><span id="L-634"><a href="#L-634"><span class="linenos">634</span></a><span class="sd">        :param X: dataset to apply noise to</span>
-</span><span id="L-635"><a href="#L-635"><span class="linenos">635</span></a><span class="sd">        :param y: required target labels for categorical noise generation</span>
-</span><span id="L-636"><a href="#L-636"><span class="linenos">636</span></a><span class="sd">        :param p: amount of noise to apply. Defaults to 0.2</span>
-</span><span id="L-637"><a href="#L-637"><span class="linenos">637</span></a><span class="sd">        :param type: type of noise to apply, either categorical or missing</span>
-</span><span id="L-638"><a href="#L-638"><span class="linenos">638</span></a><span class="sd">        :param missing_val: value to simulate missing values. Defaults to float(&#39;-inf&#39;)</span>
-</span><span id="L-639"><a href="#L-639"><span class="linenos">639</span></a><span class="sd">        :return: X with noise applied</span>
-</span><span id="L-640"><a href="#L-640"><span class="linenos">640</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-641"><a href="#L-641"><span class="linenos">641</span></a>
-</span><span id="L-642"><a href="#L-642"><span class="linenos">642</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="L-643"><a href="#L-643"><span class="linenos">643</span></a>            <span class="s1">&#39;type&#39;</span><span class="p">:</span> <span class="nb">type</span><span class="p">,</span>
-</span><span id="L-644"><a href="#L-644"><span class="linenos">644</span></a>            <span class="s1">&#39;amount&#39;</span><span class="p">:</span> <span class="n">p</span><span class="p">,</span>
-</span><span id="L-645"><a href="#L-645"><span class="linenos">645</span></a>        <span class="p">})</span>
-</span><span id="L-646"><a href="#L-646"><span class="linenos">646</span></a>
-</span><span id="L-647"><a href="#L-647"><span class="linenos">647</span></a>        <span class="k">if</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;categorical&#39;</span><span class="p">:</span>
-</span><span id="L-648"><a href="#L-648"><span class="linenos">648</span></a>            <span class="n">label_values</span><span class="p">,</span> <span class="n">label_count</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="L-649"><a href="#L-649"><span class="linenos">649</span></a>            <span class="n">n_labels</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">label_values</span><span class="p">)</span>
-</span><span id="L-650"><a href="#L-650"><span class="linenos">650</span></a>
-</span><span id="L-651"><a href="#L-651"><span class="linenos">651</span></a>            <span class="n">inds</span> <span class="o">=</span> <span class="n">y</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
-</span><span id="L-652"><a href="#L-652"><span class="linenos">652</span></a>            <span class="n">y_sort</span> <span class="o">=</span> <span class="n">y</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
-</span><span id="L-653"><a href="#L-653"><span class="linenos">653</span></a>            <span class="n">X_sort</span> <span class="o">=</span> <span class="n">X</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
+</span><span id="L-621"><a href="#L-621"><span class="linenos">621</span></a>                    <span class="n">sample_indices_slice</span> <span class="o">=</span> <span class="n">closest_sample_indices</span><span class="p">[:</span><span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span>
+</span><span id="L-622"><a href="#L-622"><span class="linenos">622</span></a>                    <span class="n">overflow_indices_slice</span> <span class="o">=</span> <span class="n">overflow_indices_sorted</span><span class="p">[:</span><span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span>
+</span><span id="L-623"><a href="#L-623"><span class="linenos">623</span></a>
+</span><span id="L-624"><a href="#L-624"><span class="linenos">624</span></a>                    <span class="n">cluster_labels</span><span class="p">[</span><span class="n">overflow_indices_slice</span><span class="p">]</span> <span class="o">=</span> <span class="n">i</span>
+</span><span id="L-625"><a href="#L-625"><span class="linenos">625</span></a>
+</span><span id="L-626"><a href="#L-626"><span class="linenos">626</span></a>                    <span class="n">overflow_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">delete</span><span class="p">(</span><span class="n">overflow_samples</span><span class="p">,</span> <span class="n">sample_indices_slice</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="L-627"><a href="#L-627"><span class="linenos">627</span></a>                    <span class="n">overflow_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">delete</span><span class="p">(</span><span class="n">overflow_indices</span><span class="p">,</span> <span class="n">sample_indices_slice</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="L-628"><a href="#L-628"><span class="linenos">628</span></a>
+</span><span id="L-629"><a href="#L-629"><span class="linenos">629</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">cluster_labels</span><span class="p">)</span>
+</span><span id="L-630"><a href="#L-630"><span class="linenos">630</span></a>
+</span><span id="L-631"><a href="#L-631"><span class="linenos">631</span></a>    <span class="k">def</span> <span class="nf">generate_noise</span><span class="p">(</span>
+</span><span id="L-632"><a href="#L-632"><span class="linenos">632</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-633"><a href="#L-633"><span class="linenos">633</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-634"><a href="#L-634"><span class="linenos">634</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-635"><a href="#L-635"><span class="linenos">635</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.2</span><span class="p">,</span>
+</span><span id="L-636"><a href="#L-636"><span class="linenos">636</span></a>        <span class="nb">type</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;categorical&#39;</span><span class="p">,</span> <span class="s1">&#39;missing&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;categorical&#39;</span><span class="p">,</span>
+</span><span id="L-637"><a href="#L-637"><span class="linenos">637</span></a>        <span class="n">missing_val</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;-inf&#39;</span><span class="p">),</span>
+</span><span id="L-638"><a href="#L-638"><span class="linenos">638</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="L-639"><a href="#L-639"><span class="linenos">639</span></a>
+</span><span id="L-640"><a href="#L-640"><span class="linenos">640</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-641"><a href="#L-641"><span class="linenos">641</span></a><span class="sd">        Simulates noise on given dataset X</span>
+</span><span id="L-642"><a href="#L-642"><span class="linenos">642</span></a><span class="sd">        :param X: dataset to apply noise to</span>
+</span><span id="L-643"><a href="#L-643"><span class="linenos">643</span></a><span class="sd">        :param y: required target labels for categorical noise generation</span>
+</span><span id="L-644"><a href="#L-644"><span class="linenos">644</span></a><span class="sd">        :param p: amount of noise to apply. Defaults to 0.2</span>
+</span><span id="L-645"><a href="#L-645"><span class="linenos">645</span></a><span class="sd">        :param type: type of noise to apply, either categorical or missing</span>
+</span><span id="L-646"><a href="#L-646"><span class="linenos">646</span></a><span class="sd">        :param missing_val: value to simulate missing values. Defaults to float(&#39;-inf&#39;)</span>
+</span><span id="L-647"><a href="#L-647"><span class="linenos">647</span></a><span class="sd">        :return: X with noise applied</span>
+</span><span id="L-648"><a href="#L-648"><span class="linenos">648</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-649"><a href="#L-649"><span class="linenos">649</span></a>
+</span><span id="L-650"><a href="#L-650"><span class="linenos">650</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="L-651"><a href="#L-651"><span class="linenos">651</span></a>            <span class="s1">&#39;type&#39;</span><span class="p">:</span> <span class="nb">type</span><span class="p">,</span>
+</span><span id="L-652"><a href="#L-652"><span class="linenos">652</span></a>            <span class="s1">&#39;amount&#39;</span><span class="p">:</span> <span class="n">p</span><span class="p">,</span>
+</span><span id="L-653"><a href="#L-653"><span class="linenos">653</span></a>        <span class="p">})</span>
 </span><span id="L-654"><a href="#L-654"><span class="linenos">654</span></a>
-</span><span id="L-655"><a href="#L-655"><span class="linenos">655</span></a>            <span class="n">Xs_T</span> <span class="o">=</span> <span class="n">X_sort</span><span class="o">.</span><span class="n">T</span>
-</span><span id="L-656"><a href="#L-656"><span class="linenos">656</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="L-657"><a href="#L-657"><span class="linenos">657</span></a>            <span class="n">n_flip</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
+</span><span id="L-655"><a href="#L-655"><span class="linenos">655</span></a>        <span class="k">if</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;categorical&#39;</span><span class="p">:</span>
+</span><span id="L-656"><a href="#L-656"><span class="linenos">656</span></a>            <span class="n">label_values</span><span class="p">,</span> <span class="n">label_count</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="L-657"><a href="#L-657"><span class="linenos">657</span></a>            <span class="n">n_labels</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">label_values</span><span class="p">)</span>
 </span><span id="L-658"><a href="#L-658"><span class="linenos">658</span></a>
-</span><span id="L-659"><a href="#L-659"><span class="linenos">659</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xs_T</span><span class="p">:</span>
-</span><span id="L-660"><a href="#L-660"><span class="linenos">660</span></a>                <span class="n">unique_per_label</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="L-661"><a href="#L-661"><span class="linenos">661</span></a>
-</span><span id="L-662"><a href="#L-662"><span class="linenos">662</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_labels</span><span class="p">):</span>
-</span><span id="L-663"><a href="#L-663"><span class="linenos">663</span></a>                    <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="L-664"><a href="#L-664"><span class="linenos">664</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]])</span>
-</span><span id="L-665"><a href="#L-665"><span class="linenos">665</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
-</span><span id="L-666"><a href="#L-666"><span class="linenos">666</span></a>                    <span class="k">else</span><span class="p">:</span>
-</span><span id="L-667"><a href="#L-667"><span class="linenos">667</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">-</span> <span class="mi">1</span><span class="p">])</span>
-</span><span id="L-668"><a href="#L-668"><span class="linenos">668</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
+</span><span id="L-659"><a href="#L-659"><span class="linenos">659</span></a>            <span class="n">inds</span> <span class="o">=</span> <span class="n">y</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
+</span><span id="L-660"><a href="#L-660"><span class="linenos">660</span></a>            <span class="n">y_sort</span> <span class="o">=</span> <span class="n">y</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
+</span><span id="L-661"><a href="#L-661"><span class="linenos">661</span></a>            <span class="n">X_sort</span> <span class="o">=</span> <span class="n">X</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
+</span><span id="L-662"><a href="#L-662"><span class="linenos">662</span></a>
+</span><span id="L-663"><a href="#L-663"><span class="linenos">663</span></a>            <span class="n">Xs_T</span> <span class="o">=</span> <span class="n">X_sort</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-664"><a href="#L-664"><span class="linenos">664</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="L-665"><a href="#L-665"><span class="linenos">665</span></a>            <span class="n">n_flip</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
+</span><span id="L-666"><a href="#L-666"><span class="linenos">666</span></a>
+</span><span id="L-667"><a href="#L-667"><span class="linenos">667</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xs_T</span><span class="p">:</span>
+</span><span id="L-668"><a href="#L-668"><span class="linenos">668</span></a>                <span class="n">unique_per_label</span> <span class="o">=</span> <span class="p">{}</span>
 </span><span id="L-669"><a href="#L-669"><span class="linenos">669</span></a>
-</span><span id="L-670"><a href="#L-670"><span class="linenos">670</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_flip</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-</span><span id="L-671"><a href="#L-671"><span class="linenos">671</span></a>
-</span><span id="L-672"><a href="#L-672"><span class="linenos">672</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
-</span><span id="L-673"><a href="#L-673"><span class="linenos">673</span></a>                    <span class="n">current_label</span> <span class="o">=</span> <span class="n">y_sort</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span>
-</span><span id="L-674"><a href="#L-674"><span class="linenos">674</span></a>                    <span class="n">possible_labels</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">label_values</span> <span class="o">!=</span> <span class="n">current_label</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="L-675"><a href="#L-675"><span class="linenos">675</span></a>
-</span><span id="L-676"><a href="#L-676"><span class="linenos">676</span></a>                    <span class="c1"># find all unique values from labels != current label</span>
-</span><span id="L-677"><a href="#L-677"><span class="linenos">677</span></a>                    <span class="n">values</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span>
-</span><span id="L-678"><a href="#L-678"><span class="linenos">678</span></a>                    <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">possible_labels</span><span class="p">:</span>
-</span><span id="L-679"><a href="#L-679"><span class="linenos">679</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">values</span><span class="o">.</span><span class="n">union</span><span class="p">(</span><span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">])</span>
-</span><span id="L-680"><a href="#L-680"><span class="linenos">680</span></a>
-</span><span id="L-681"><a href="#L-681"><span class="linenos">681</span></a>                    <span class="c1"># remove any overlapping values, ensuring replacement values are unique &amp; from a target label !=</span>
-</span><span id="L-682"><a href="#L-682"><span class="linenos">682</span></a>                    <span class="c1"># current label</span>
-</span><span id="L-683"><a href="#L-683"><span class="linenos">683</span></a>                    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">current_label</span><span class="p">]</span> <span class="o">&amp;</span> <span class="n">values</span><span class="p">:</span>
-</span><span id="L-684"><a href="#L-684"><span class="linenos">684</span></a>                        <span class="n">values</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">val</span><span class="p">)</span>
-</span><span id="L-685"><a href="#L-685"><span class="linenos">685</span></a>
-</span><span id="L-686"><a href="#L-686"><span class="linenos">686</span></a>                    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">values</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="L-687"><a href="#L-687"><span class="linenos">687</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
+</span><span id="L-670"><a href="#L-670"><span class="linenos">670</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_labels</span><span class="p">):</span>
+</span><span id="L-671"><a href="#L-671"><span class="linenos">671</span></a>                    <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-672"><a href="#L-672"><span class="linenos">672</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]])</span>
+</span><span id="L-673"><a href="#L-673"><span class="linenos">673</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
+</span><span id="L-674"><a href="#L-674"><span class="linenos">674</span></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="L-675"><a href="#L-675"><span class="linenos">675</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">-</span> <span class="mi">1</span><span class="p">])</span>
+</span><span id="L-676"><a href="#L-676"><span class="linenos">676</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
+</span><span id="L-677"><a href="#L-677"><span class="linenos">677</span></a>
+</span><span id="L-678"><a href="#L-678"><span class="linenos">678</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_flip</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="L-679"><a href="#L-679"><span class="linenos">679</span></a>
+</span><span id="L-680"><a href="#L-680"><span class="linenos">680</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
+</span><span id="L-681"><a href="#L-681"><span class="linenos">681</span></a>                    <span class="n">current_label</span> <span class="o">=</span> <span class="n">y_sort</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span>
+</span><span id="L-682"><a href="#L-682"><span class="linenos">682</span></a>                    <span class="n">possible_labels</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">label_values</span> <span class="o">!=</span> <span class="n">current_label</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="L-683"><a href="#L-683"><span class="linenos">683</span></a>
+</span><span id="L-684"><a href="#L-684"><span class="linenos">684</span></a>                    <span class="c1"># find all unique values from labels != current label</span>
+</span><span id="L-685"><a href="#L-685"><span class="linenos">685</span></a>                    <span class="n">values</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span>
+</span><span id="L-686"><a href="#L-686"><span class="linenos">686</span></a>                    <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">possible_labels</span><span class="p">:</span>
+</span><span id="L-687"><a href="#L-687"><span class="linenos">687</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">values</span><span class="o">.</span><span class="n">union</span><span class="p">(</span><span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">])</span>
 </span><span id="L-688"><a href="#L-688"><span class="linenos">688</span></a>
-</span><span id="L-689"><a href="#L-689"><span class="linenos">689</span></a>                    <span class="k">else</span><span class="p">:</span>
-</span><span id="L-690"><a href="#L-690"><span class="linenos">690</span></a>                        <span class="n">key</span> <span class="o">=</span> <span class="n">possible_labels</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">possible_labels</span><span class="p">))]</span>
-</span><span id="L-691"><a href="#L-691"><span class="linenos">691</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
-</span><span id="L-692"><a href="#L-692"><span class="linenos">692</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
+</span><span id="L-689"><a href="#L-689"><span class="linenos">689</span></a>                    <span class="c1"># remove any overlapping values, ensuring replacement values are unique &amp; from a target label !=</span>
+</span><span id="L-690"><a href="#L-690"><span class="linenos">690</span></a>                    <span class="c1"># current label</span>
+</span><span id="L-691"><a href="#L-691"><span class="linenos">691</span></a>                    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">current_label</span><span class="p">]</span> <span class="o">&amp;</span> <span class="n">values</span><span class="p">:</span>
+</span><span id="L-692"><a href="#L-692"><span class="linenos">692</span></a>                        <span class="n">values</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">val</span><span class="p">)</span>
 </span><span id="L-693"><a href="#L-693"><span class="linenos">693</span></a>
-</span><span id="L-694"><a href="#L-694"><span class="linenos">694</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">val</span>
-</span><span id="L-695"><a href="#L-695"><span class="linenos">695</span></a>
-</span><span id="L-696"><a href="#L-696"><span class="linenos">696</span></a>            <span class="n">rev_ind</span> <span class="o">=</span> <span class="n">inds</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
-</span><span id="L-697"><a href="#L-697"><span class="linenos">697</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">T</span>
-</span><span id="L-698"><a href="#L-698"><span class="linenos">698</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">X_noise</span><span class="p">[</span><span class="n">rev_ind</span><span class="p">]</span>
-</span><span id="L-699"><a href="#L-699"><span class="linenos">699</span></a>
-</span><span id="L-700"><a href="#L-700"><span class="linenos">700</span></a>            <span class="k">return</span> <span class="n">X_noise</span>
+</span><span id="L-694"><a href="#L-694"><span class="linenos">694</span></a>                    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">values</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-695"><a href="#L-695"><span class="linenos">695</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
+</span><span id="L-696"><a href="#L-696"><span class="linenos">696</span></a>
+</span><span id="L-697"><a href="#L-697"><span class="linenos">697</span></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="L-698"><a href="#L-698"><span class="linenos">698</span></a>                        <span class="n">key</span> <span class="o">=</span> <span class="n">possible_labels</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">possible_labels</span><span class="p">))]</span>
+</span><span id="L-699"><a href="#L-699"><span class="linenos">699</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
+</span><span id="L-700"><a href="#L-700"><span class="linenos">700</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
 </span><span id="L-701"><a href="#L-701"><span class="linenos">701</span></a>
-</span><span id="L-702"><a href="#L-702"><span class="linenos">702</span></a>        <span class="k">elif</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;missing&#39;</span><span class="p">:</span>
-</span><span id="L-703"><a href="#L-703"><span class="linenos">703</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-</span><span id="L-704"><a href="#L-704"><span class="linenos">704</span></a>            <span class="n">Xn_T</span> <span class="o">=</span> <span class="n">X_noise</span><span class="o">.</span><span class="n">T</span>
-</span><span id="L-705"><a href="#L-705"><span class="linenos">705</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="L-706"><a href="#L-706"><span class="linenos">706</span></a>            <span class="n">n_missing</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
-</span><span id="L-707"><a href="#L-707"><span class="linenos">707</span></a>            <span class="c1">#print(&quot;n to delete:&quot;, n_missing)</span>
-</span><span id="L-708"><a href="#L-708"><span class="linenos">708</span></a>
-</span><span id="L-709"><a href="#L-709"><span class="linenos">709</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xn_T</span><span class="p">:</span>
-</span><span id="L-710"><a href="#L-710"><span class="linenos">710</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_missing</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-</span><span id="L-711"><a href="#L-711"><span class="linenos">711</span></a>
-</span><span id="L-712"><a href="#L-712"><span class="linenos">712</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
-</span><span id="L-713"><a href="#L-713"><span class="linenos">713</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">missing_val</span>
-</span><span id="L-714"><a href="#L-714"><span class="linenos">714</span></a>
-</span><span id="L-715"><a href="#L-715"><span class="linenos">715</span></a>            <span class="k">return</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-702"><a href="#L-702"><span class="linenos">702</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">val</span>
+</span><span id="L-703"><a href="#L-703"><span class="linenos">703</span></a>
+</span><span id="L-704"><a href="#L-704"><span class="linenos">704</span></a>            <span class="n">rev_ind</span> <span class="o">=</span> <span class="n">inds</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
+</span><span id="L-705"><a href="#L-705"><span class="linenos">705</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-706"><a href="#L-706"><span class="linenos">706</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">X_noise</span><span class="p">[</span><span class="n">rev_ind</span><span class="p">]</span>
+</span><span id="L-707"><a href="#L-707"><span class="linenos">707</span></a>
+</span><span id="L-708"><a href="#L-708"><span class="linenos">708</span></a>            <span class="k">return</span> <span class="n">X_noise</span>
+</span><span id="L-709"><a href="#L-709"><span class="linenos">709</span></a>
+</span><span id="L-710"><a href="#L-710"><span class="linenos">710</span></a>        <span class="k">elif</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;missing&#39;</span><span class="p">:</span>
+</span><span id="L-711"><a href="#L-711"><span class="linenos">711</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="L-712"><a href="#L-712"><span class="linenos">712</span></a>            <span class="n">Xn_T</span> <span class="o">=</span> <span class="n">X_noise</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-713"><a href="#L-713"><span class="linenos">713</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="L-714"><a href="#L-714"><span class="linenos">714</span></a>            <span class="n">n_missing</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
+</span><span id="L-715"><a href="#L-715"><span class="linenos">715</span></a>            <span class="c1">#print(&quot;n to delete:&quot;, n_missing)</span>
 </span><span id="L-716"><a href="#L-716"><span class="linenos">716</span></a>
-</span><span id="L-717"><a href="#L-717"><span class="linenos">717</span></a>    <span class="k">def</span> <span class="nf">downsample_dataset</span><span class="p">(</span>
-</span><span id="L-718"><a href="#L-718"><span class="linenos">718</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="L-719"><a href="#L-719"><span class="linenos">719</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="L-720"><a href="#L-720"><span class="linenos">720</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="L-721"><a href="#L-721"><span class="linenos">721</span></a>        <span class="n">N</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="L-722"><a href="#L-722"><span class="linenos">722</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
-</span><span id="L-723"><a href="#L-723"><span class="linenos">723</span></a>        <span class="n">reshuffle</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="L-724"><a href="#L-724"><span class="linenos">724</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">]:</span>
-</span><span id="L-725"><a href="#L-725"><span class="linenos">725</span></a>
-</span><span id="L-726"><a href="#L-726"><span class="linenos">726</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="L-727"><a href="#L-727"><span class="linenos">727</span></a><span class="sd">        Downsamples dataset X according to N or the number of samples in minority class, resulting in a balanced dataset.</span>
-</span><span id="L-728"><a href="#L-728"><span class="linenos">728</span></a><span class="sd">        :param X: Dataset to downsample</span>
-</span><span id="L-729"><a href="#L-729"><span class="linenos">729</span></a><span class="sd">        :param y: Labels corresponding to X</span>
-</span><span id="L-730"><a href="#L-730"><span class="linenos">730</span></a><span class="sd">        :param N: Optional number of samples per class to downsample to</span>
-</span><span id="L-731"><a href="#L-731"><span class="linenos">731</span></a><span class="sd">        :param seed: Seed for random state of resample function</span>
-</span><span id="L-732"><a href="#L-732"><span class="linenos">732</span></a><span class="sd">        :param reshuffle: Reshuffle the dataset after downsampling</span>
-</span><span id="L-733"><a href="#L-733"><span class="linenos">733</span></a><span class="sd">        :return: Balanced X and y after downsampling</span>
-</span><span id="L-734"><a href="#L-734"><span class="linenos">734</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-735"><a href="#L-735"><span class="linenos">735</span></a>
-</span><span id="L-736"><a href="#L-736"><span class="linenos">736</span></a>        <span class="n">original_shape</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="L-737"><a href="#L-737"><span class="linenos">737</span></a>
-</span><span id="L-738"><a href="#L-738"><span class="linenos">738</span></a>        <span class="n">values</span><span class="p">,</span> <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="L-739"><a href="#L-739"><span class="linenos">739</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-740"><a href="#L-740"><span class="linenos">740</span></a>            <span class="n">N</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">)</span>
-</span><span id="L-741"><a href="#L-741"><span class="linenos">741</span></a>
-</span><span id="L-742"><a href="#L-742"><span class="linenos">742</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="o">&gt;</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">):</span>
-</span><span id="L-743"><a href="#L-743"><span class="linenos">743</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;N must be equal to or less than the number of samples in minority class&#39;</span><span class="p">)</span>
-</span><span id="L-744"><a href="#L-744"><span class="linenos">744</span></a>
-</span><span id="L-745"><a href="#L-745"><span class="linenos">745</span></a>        <span class="n">X_arrays_list</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-746"><a href="#L-746"><span class="linenos">746</span></a>        <span class="n">y_downsampled</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-747"><a href="#L-747"><span class="linenos">747</span></a>        <span class="k">for</span> <span class="n">label</span> <span class="ow">in</span> <span class="n">values</span><span class="p">:</span>
-</span><span id="L-748"><a href="#L-748"><span class="linenos">748</span></a>            <span class="n">X_label</span> <span class="o">=</span> <span class="p">[</span><span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">y</span><span class="p">))</span> <span class="k">if</span> <span class="n">y</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">==</span> <span class="n">label</span><span class="p">]</span>
-</span><span id="L-749"><a href="#L-749"><span class="linenos">749</span></a>            <span class="n">X_label_downsample</span> <span class="o">=</span> <span class="n">resample</span><span class="p">(</span>
-</span><span id="L-750"><a href="#L-750"><span class="linenos">750</span></a>                <span class="n">X_label</span><span class="p">,</span>
-</span><span id="L-751"><a href="#L-751"><span class="linenos">751</span></a>                <span class="n">replace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-</span><span id="L-752"><a href="#L-752"><span class="linenos">752</span></a>                <span class="n">n_samples</span><span class="o">=</span><span class="n">N</span><span class="p">,</span>
-</span><span id="L-753"><a href="#L-753"><span class="linenos">753</span></a>                <span class="n">random_state</span><span class="o">=</span><span class="n">seed</span><span class="p">,</span>
-</span><span id="L-754"><a href="#L-754"><span class="linenos">754</span></a>            <span class="p">)</span>
-</span><span id="L-755"><a href="#L-755"><span class="linenos">755</span></a>            <span class="n">X_arrays_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">X_label_downsample</span><span class="p">)</span>
-</span><span id="L-756"><a href="#L-756"><span class="linenos">756</span></a>            <span class="n">ys</span> <span class="o">=</span> <span class="p">[</span><span class="n">label</span><span class="p">]</span> <span class="o">*</span> <span class="n">N</span>
-</span><span id="L-757"><a href="#L-757"><span class="linenos">757</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">y_downsampled</span><span class="p">,</span> <span class="n">ys</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="L-758"><a href="#L-758"><span class="linenos">758</span></a>
-</span><span id="L-759"><a href="#L-759"><span class="linenos">759</span></a>        <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">X_arrays_list</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="L-760"><a href="#L-760"><span class="linenos">760</span></a>
-</span><span id="L-761"><a href="#L-761"><span class="linenos">761</span></a>        <span class="k">if</span> <span class="n">reshuffle</span><span class="p">:</span>
-</span><span id="L-762"><a href="#L-762"><span class="linenos">762</span></a>            <span class="n">indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X_downsampled</span><span class="p">))</span>
-</span><span id="L-763"><a href="#L-763"><span class="linenos">763</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">indices</span><span class="p">)</span>
-</span><span id="L-764"><a href="#L-764"><span class="linenos">764</span></a>            <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
-</span><span id="L-765"><a href="#L-765"><span class="linenos">765</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">y_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
-</span><span id="L-766"><a href="#L-766"><span class="linenos">766</span></a>
-</span><span id="L-767"><a href="#L-767"><span class="linenos">767</span></a>        <span class="n">downsampled_shape</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="L-768"><a href="#L-768"><span class="linenos">768</span></a>
-</span><span id="L-769"><a href="#L-769"><span class="linenos">769</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
-</span><span id="L-770"><a href="#L-770"><span class="linenos">770</span></a>            <span class="s1">&#39;downsampling&#39;</span><span class="p">:</span> <span class="p">{</span>
-</span><span id="L-771"><a href="#L-771"><span class="linenos">771</span></a>                <span class="s1">&#39;original_shape&#39;</span><span class="p">:</span> <span class="n">original_shape</span><span class="p">,</span>
-</span><span id="L-772"><a href="#L-772"><span class="linenos">772</span></a>                <span class="s1">&#39;downsampled_shape&#39;</span><span class="p">:</span> <span class="n">downsampled_shape</span><span class="p">,</span>
-</span><span id="L-773"><a href="#L-773"><span class="linenos">773</span></a>            <span class="p">},</span>
-</span><span id="L-774"><a href="#L-774"><span class="linenos">774</span></a>        <span class="p">})</span>
-</span><span id="L-775"><a href="#L-775"><span class="linenos">775</span></a>
-</span><span id="L-776"><a href="#L-776"><span class="linenos">776</span></a>        <span class="k">return</span> <span class="n">X_downsampled</span><span class="p">,</span> <span class="n">y_downsampled</span>
+</span><span id="L-717"><a href="#L-717"><span class="linenos">717</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xn_T</span><span class="p">:</span>
+</span><span id="L-718"><a href="#L-718"><span class="linenos">718</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_missing</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="L-719"><a href="#L-719"><span class="linenos">719</span></a>
+</span><span id="L-720"><a href="#L-720"><span class="linenos">720</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
+</span><span id="L-721"><a href="#L-721"><span class="linenos">721</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">missing_val</span>
+</span><span id="L-722"><a href="#L-722"><span class="linenos">722</span></a>
+</span><span id="L-723"><a href="#L-723"><span class="linenos">723</span></a>            <span class="k">return</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">T</span>
+</span><span id="L-724"><a href="#L-724"><span class="linenos">724</span></a>
+</span><span id="L-725"><a href="#L-725"><span class="linenos">725</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-726"><a href="#L-726"><span class="linenos">726</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Type </span><span class="si">{</span><span class="nb">type</span><span class="si">}</span><span class="s1"> not supported&#39;</span><span class="p">)</span>
+</span><span id="L-727"><a href="#L-727"><span class="linenos">727</span></a>
+</span><span id="L-728"><a href="#L-728"><span class="linenos">728</span></a>    <span class="k">def</span> <span class="nf">downsample_dataset</span><span class="p">(</span>
+</span><span id="L-729"><a href="#L-729"><span class="linenos">729</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-730"><a href="#L-730"><span class="linenos">730</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-731"><a href="#L-731"><span class="linenos">731</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-732"><a href="#L-732"><span class="linenos">732</span></a>        <span class="n">N</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-733"><a href="#L-733"><span class="linenos">733</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
+</span><span id="L-734"><a href="#L-734"><span class="linenos">734</span></a>        <span class="n">reshuffle</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-735"><a href="#L-735"><span class="linenos">735</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">]:</span>
+</span><span id="L-736"><a href="#L-736"><span class="linenos">736</span></a>
+</span><span id="L-737"><a href="#L-737"><span class="linenos">737</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-738"><a href="#L-738"><span class="linenos">738</span></a><span class="sd">        Downsamples dataset X according to N or the number of samples in minority class, resulting in a balanced dataset.</span>
+</span><span id="L-739"><a href="#L-739"><span class="linenos">739</span></a><span class="sd">        :param X: Dataset to downsample</span>
+</span><span id="L-740"><a href="#L-740"><span class="linenos">740</span></a><span class="sd">        :param y: Labels corresponding to X</span>
+</span><span id="L-741"><a href="#L-741"><span class="linenos">741</span></a><span class="sd">        :param N: Optional number of samples per class to downsample to</span>
+</span><span id="L-742"><a href="#L-742"><span class="linenos">742</span></a><span class="sd">        :param seed: Seed for random state of resample function</span>
+</span><span id="L-743"><a href="#L-743"><span class="linenos">743</span></a><span class="sd">        :param reshuffle: Reshuffle the dataset after downsampling</span>
+</span><span id="L-744"><a href="#L-744"><span class="linenos">744</span></a><span class="sd">        :return: Balanced X and y after downsampling</span>
+</span><span id="L-745"><a href="#L-745"><span class="linenos">745</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-746"><a href="#L-746"><span class="linenos">746</span></a>
+</span><span id="L-747"><a href="#L-747"><span class="linenos">747</span></a>        <span class="n">original_shape</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="L-748"><a href="#L-748"><span class="linenos">748</span></a>
+</span><span id="L-749"><a href="#L-749"><span class="linenos">749</span></a>        <span class="n">values</span><span class="p">,</span> <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="L-750"><a href="#L-750"><span class="linenos">750</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-751"><a href="#L-751"><span class="linenos">751</span></a>            <span class="n">N</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">)</span>
+</span><span id="L-752"><a href="#L-752"><span class="linenos">752</span></a>
+</span><span id="L-753"><a href="#L-753"><span class="linenos">753</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="o">&gt;</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">):</span>
+</span><span id="L-754"><a href="#L-754"><span class="linenos">754</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;N must be equal to or less than the number of samples in minority class&#39;</span><span class="p">)</span>
+</span><span id="L-755"><a href="#L-755"><span class="linenos">755</span></a>
+</span><span id="L-756"><a href="#L-756"><span class="linenos">756</span></a>        <span class="n">X_arrays_list</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-757"><a href="#L-757"><span class="linenos">757</span></a>        <span class="n">y_downsampled</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-758"><a href="#L-758"><span class="linenos">758</span></a>        <span class="k">for</span> <span class="n">label</span> <span class="ow">in</span> <span class="n">values</span><span class="p">:</span>
+</span><span id="L-759"><a href="#L-759"><span class="linenos">759</span></a>            <span class="n">X_label</span> <span class="o">=</span> <span class="p">[</span><span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">y</span><span class="p">))</span> <span class="k">if</span> <span class="n">y</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">==</span> <span class="n">label</span><span class="p">]</span>
+</span><span id="L-760"><a href="#L-760"><span class="linenos">760</span></a>            <span class="n">X_label_downsample</span> <span class="o">=</span> <span class="n">resample</span><span class="p">(</span>
+</span><span id="L-761"><a href="#L-761"><span class="linenos">761</span></a>                <span class="n">X_label</span><span class="p">,</span>
+</span><span id="L-762"><a href="#L-762"><span class="linenos">762</span></a>                <span class="n">replace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+</span><span id="L-763"><a href="#L-763"><span class="linenos">763</span></a>                <span class="n">n_samples</span><span class="o">=</span><span class="n">N</span><span class="p">,</span>
+</span><span id="L-764"><a href="#L-764"><span class="linenos">764</span></a>                <span class="n">random_state</span><span class="o">=</span><span class="n">seed</span><span class="p">,</span>
+</span><span id="L-765"><a href="#L-765"><span class="linenos">765</span></a>            <span class="p">)</span>
+</span><span id="L-766"><a href="#L-766"><span class="linenos">766</span></a>            <span class="n">X_arrays_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">X_label_downsample</span><span class="p">)</span>
+</span><span id="L-767"><a href="#L-767"><span class="linenos">767</span></a>            <span class="n">ys</span> <span class="o">=</span> <span class="p">[</span><span class="n">label</span><span class="p">]</span> <span class="o">*</span> <span class="n">N</span>
+</span><span id="L-768"><a href="#L-768"><span class="linenos">768</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">y_downsampled</span><span class="p">,</span> <span class="n">ys</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="L-769"><a href="#L-769"><span class="linenos">769</span></a>
+</span><span id="L-770"><a href="#L-770"><span class="linenos">770</span></a>        <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">X_arrays_list</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="L-771"><a href="#L-771"><span class="linenos">771</span></a>
+</span><span id="L-772"><a href="#L-772"><span class="linenos">772</span></a>        <span class="k">if</span> <span class="n">reshuffle</span><span class="p">:</span>
+</span><span id="L-773"><a href="#L-773"><span class="linenos">773</span></a>            <span class="n">indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X_downsampled</span><span class="p">))</span>
+</span><span id="L-774"><a href="#L-774"><span class="linenos">774</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">indices</span><span class="p">)</span>
+</span><span id="L-775"><a href="#L-775"><span class="linenos">775</span></a>            <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
+</span><span id="L-776"><a href="#L-776"><span class="linenos">776</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">y_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
 </span><span id="L-777"><a href="#L-777"><span class="linenos">777</span></a>
-</span><span id="L-778"><a href="#L-778"><span class="linenos">778</span></a>    <span class="k">def</span> <span class="nf">print_dataset</span><span class="p">(</span>
-</span><span id="L-779"><a href="#L-779"><span class="linenos">779</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="L-780"><a href="#L-780"><span class="linenos">780</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="L-781"><a href="#L-781"><span class="linenos">781</span></a>        <span class="n">y</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="L-782"><a href="#L-782"><span class="linenos">782</span></a>    <span class="p">):</span>
-</span><span id="L-783"><a href="#L-783"><span class="linenos">783</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="L-784"><a href="#L-784"><span class="linenos">784</span></a><span class="sd">        Prints given dataset</span>
-</span><span id="L-785"><a href="#L-785"><span class="linenos">785</span></a><span class="sd">        :param X: dataset</span>
-</span><span id="L-786"><a href="#L-786"><span class="linenos">786</span></a><span class="sd">        :param y: labels</span>
-</span><span id="L-787"><a href="#L-787"><span class="linenos">787</span></a><span class="sd">        :return:</span>
-</span><span id="L-788"><a href="#L-788"><span class="linenos">788</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-789"><a href="#L-789"><span class="linenos">789</span></a>
-</span><span id="L-790"><a href="#L-790"><span class="linenos">790</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="L-791"><a href="#L-791"><span class="linenos">791</span></a>        <span class="n">n</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="L-792"><a href="#L-792"><span class="linenos">792</span></a>        <span class="k">for</span> <span class="n">arr</span> <span class="ow">in</span> <span class="n">X</span><span class="p">:</span>
-</span><span id="L-793"><a href="#L-793"><span class="linenos">793</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;[&#39;</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
-</span><span id="L-794"><a href="#L-794"><span class="linenos">794</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
-</span><span id="L-795"><a href="#L-795"><span class="linenos">795</span></a>                <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="n">n_features</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="L-796"><a href="#L-796"><span class="linenos">796</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
-</span><span id="L-797"><a href="#L-797"><span class="linenos">797</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="L-798"><a href="#L-798"><span class="linenos">798</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;, &#39;</span><span class="p">)</span>
-</span><span id="L-799"><a href="#L-799"><span class="linenos">799</span></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;], Label: </span><span class="si">{</span><span class="n">y</span><span class="p">[</span><span class="n">n</span><span class="p">]</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="L-800"><a href="#L-800"><span class="linenos">800</span></a>            <span class="n">n</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="L-801"><a href="#L-801"><span class="linenos">801</span></a>
-</span><span id="L-802"><a href="#L-802"><span class="linenos">802</span></a>    <span class="k">def</span> <span class="nf">summarize</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-</span><span id="L-803"><a href="#L-803"><span class="linenos">803</span></a>
-</span><span id="L-804"><a href="#L-804"><span class="linenos">804</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of features: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;general&#39;</span><span class="p">][</span><span class="s1">&#39;n_features&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="L-805"><a href="#L-805"><span class="linenos">805</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of generated samples: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;general&#39;</span><span class="p">][</span><span class="s1">&#39;n_samples&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="L-806"><a href="#L-806"><span class="linenos">806</span></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">]:</span>
-</span><span id="L-807"><a href="#L-807"><span class="linenos">807</span></a>            <span class="nb">print</span><span class="p">(</span>
-</span><span id="L-808"><a href="#L-808"><span class="linenos">808</span></a>                <span class="sa">f</span><span class="s2">&quot;Dataset downsampled from shape </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">][</span><span class="s1">&#39;original_shape&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">, to shape </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">][</span><span class="s1">&#39;downsampled_shape&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="L-809"><a href="#L-809"><span class="linenos">809</span></a>            <span class="p">)</span>
-</span><span id="L-810"><a href="#L-810"><span class="linenos">810</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of classes: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;labels&#39;</span><span class="p">][</span><span class="s1">&#39;n_class&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="L-811"><a href="#L-811"><span class="linenos">811</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Class relation: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;labels&#39;</span><span class="p">][</span><span class="s1">&#39;class_relation&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="L-778"><a href="#L-778"><span class="linenos">778</span></a>        <span class="n">downsampled_shape</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="L-779"><a href="#L-779"><span class="linenos">779</span></a>
+</span><span id="L-780"><a href="#L-780"><span class="linenos">780</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="L-781"><a href="#L-781"><span class="linenos">781</span></a>            <span class="s1">&#39;downsampling&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="L-782"><a href="#L-782"><span class="linenos">782</span></a>                <span class="s1">&#39;original_shape&#39;</span><span class="p">:</span> <span class="n">original_shape</span><span class="p">,</span>
+</span><span id="L-783"><a href="#L-783"><span class="linenos">783</span></a>                <span class="s1">&#39;downsampled_shape&#39;</span><span class="p">:</span> <span class="n">downsampled_shape</span><span class="p">,</span>
+</span><span id="L-784"><a href="#L-784"><span class="linenos">784</span></a>            <span class="p">},</span>
+</span><span id="L-785"><a href="#L-785"><span class="linenos">785</span></a>        <span class="p">})</span>
+</span><span id="L-786"><a href="#L-786"><span class="linenos">786</span></a>
+</span><span id="L-787"><a href="#L-787"><span class="linenos">787</span></a>        <span class="k">return</span> <span class="n">X_downsampled</span><span class="p">,</span> <span class="n">y_downsampled</span>
+</span><span id="L-788"><a href="#L-788"><span class="linenos">788</span></a>
+</span><span id="L-789"><a href="#L-789"><span class="linenos">789</span></a>    <span class="k">def</span> <span class="nf">print_dataset</span><span class="p">(</span>
+</span><span id="L-790"><a href="#L-790"><span class="linenos">790</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-791"><a href="#L-791"><span class="linenos">791</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-792"><a href="#L-792"><span class="linenos">792</span></a>        <span class="n">y</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="L-793"><a href="#L-793"><span class="linenos">793</span></a>    <span class="p">):</span>
+</span><span id="L-794"><a href="#L-794"><span class="linenos">794</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-795"><a href="#L-795"><span class="linenos">795</span></a><span class="sd">        Prints given dataset</span>
+</span><span id="L-796"><a href="#L-796"><span class="linenos">796</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="L-797"><a href="#L-797"><span class="linenos">797</span></a><span class="sd">        :param y: labels</span>
+</span><span id="L-798"><a href="#L-798"><span class="linenos">798</span></a><span class="sd">        :return:</span>
+</span><span id="L-799"><a href="#L-799"><span class="linenos">799</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-800"><a href="#L-800"><span class="linenos">800</span></a>
+</span><span id="L-801"><a href="#L-801"><span class="linenos">801</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="L-802"><a href="#L-802"><span class="linenos">802</span></a>        <span class="n">n</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-803"><a href="#L-803"><span class="linenos">803</span></a>        <span class="k">for</span> <span class="n">arr</span> <span class="ow">in</span> <span class="n">X</span><span class="p">:</span>
+</span><span id="L-804"><a href="#L-804"><span class="linenos">804</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;[&#39;</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
+</span><span id="L-805"><a href="#L-805"><span class="linenos">805</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
+</span><span id="L-806"><a href="#L-806"><span class="linenos">806</span></a>                <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="n">n_features</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="L-807"><a href="#L-807"><span class="linenos">807</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
+</span><span id="L-808"><a href="#L-808"><span class="linenos">808</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="L-809"><a href="#L-809"><span class="linenos">809</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;, &#39;</span><span class="p">)</span>
+</span><span id="L-810"><a href="#L-810"><span class="linenos">810</span></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;], Label: </span><span class="si">{</span><span class="n">y</span><span class="p">[</span><span class="n">n</span><span class="p">]</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="L-811"><a href="#L-811"><span class="linenos">811</span></a>            <span class="n">n</span> <span class="o">+=</span> <span class="mi">1</span>
 </span><span id="L-812"><a href="#L-812"><span class="linenos">812</span></a>
-</span><span id="L-813"><a href="#L-813"><span class="linenos">813</span></a>        <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
-</span><span id="L-814"><a href="#L-814"><span class="linenos">814</span></a>
-</span><span id="L-815"><a href="#L-815"><span class="linenos">815</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="L-816"><a href="#L-816"><span class="linenos">816</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Combinations:&#39;</span><span class="p">)</span>
-</span><span id="L-817"><a href="#L-817"><span class="linenos">817</span></a>            <span class="k">for</span> <span class="n">comb</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">]:</span>
-</span><span id="L-818"><a href="#L-818"><span class="linenos">818</span></a>                <span class="nb">print</span><span class="p">(</span>
-</span><span id="L-819"><a href="#L-819"><span class="linenos">819</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are in </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;combination_type&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> combination, result in </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;combination_ix&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="L-820"><a href="#L-820"><span class="linenos">820</span></a>                <span class="p">)</span>
-</span><span id="L-821"><a href="#L-821"><span class="linenos">821</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
-</span><span id="L-822"><a href="#L-822"><span class="linenos">822</span></a>
-</span><span id="L-823"><a href="#L-823"><span class="linenos">823</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="L-824"><a href="#L-824"><span class="linenos">824</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Correlations:&#39;</span><span class="p">)</span>
-</span><span id="L-825"><a href="#L-825"><span class="linenos">825</span></a>            <span class="k">for</span> <span class="n">corr</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">]:</span>
-</span><span id="L-826"><a href="#L-826"><span class="linenos">826</span></a>                <span class="nb">print</span><span class="p">(</span>
-</span><span id="L-827"><a href="#L-827"><span class="linenos">827</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are correlated to </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;correlated_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> with a factor of </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;correlation_factor&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="L-828"><a href="#L-828"><span class="linenos">828</span></a>                <span class="p">)</span>
-</span><span id="L-829"><a href="#L-829"><span class="linenos">829</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
-</span><span id="L-830"><a href="#L-830"><span class="linenos">830</span></a>
-</span><span id="L-831"><a href="#L-831"><span class="linenos">831</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="L-832"><a href="#L-832"><span class="linenos">832</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Duplicates:&#39;</span><span class="p">)</span>
-</span><span id="L-833"><a href="#L-833"><span class="linenos">833</span></a>            <span class="k">for</span> <span class="n">dup</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">]:</span>
-</span><span id="L-834"><a href="#L-834"><span class="linenos">834</span></a>                <span class="nb">print</span><span class="p">(</span>
-</span><span id="L-835"><a href="#L-835"><span class="linenos">835</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">dup</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are duplicated, duplicate indexes are </span><span class="si">{</span><span class="n">dup</span><span class="p">[</span><span class="s1">&#39;duplicate_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="L-836"><a href="#L-836"><span class="linenos">836</span></a>                <span class="p">)</span>
-</span><span id="L-837"><a href="#L-837"><span class="linenos">837</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
-</span><span id="L-838"><a href="#L-838"><span class="linenos">838</span></a>
-</span><span id="L-839"><a href="#L-839"><span class="linenos">839</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="L-840"><a href="#L-840"><span class="linenos">840</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Simulated noise:&#39;</span><span class="p">)</span>
-</span><span id="L-841"><a href="#L-841"><span class="linenos">841</span></a>            <span class="k">for</span> <span class="n">noise</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">]:</span>
-</span><span id="L-842"><a href="#L-842"><span class="linenos">842</span></a>                <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Simulated </span><span class="si">{</span><span class="n">noise</span><span class="p">[</span><span class="s1">&#39;type&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> noise, amount of </span><span class="si">{</span><span class="n">noise</span><span class="p">[</span><span class="s1">&#39;noise_amount&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="L-843"><a href="#L-843"><span class="linenos">843</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
-</span><span id="L-844"><a href="#L-844"><span class="linenos">844</span></a>
-</span><span id="L-845"><a href="#L-845"><span class="linenos">845</span></a>        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\n</span><span class="s2">For more information on dataset structure, print cc.dataset_info[&#39;general&#39;][&#39;structure&#39;]&quot;</span><span class="p">)</span>
+</span><span id="L-813"><a href="#L-813"><span class="linenos">813</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-814"><a href="#L-814"><span class="linenos">814</span></a><span class="sd">    def summarize(self):</span>
+</span><span id="L-815"><a href="#L-815"><span class="linenos">815</span></a><span class="sd">        # TODO: Logging function</span>
+</span><span id="L-816"><a href="#L-816"><span class="linenos">816</span></a><span class="sd">    &quot;&quot;&quot;</span>
 </span></pre></div>
 
 
@@ -949,838 +920,835 @@ <h1 class="modulename">
     <a class="headerlink" href="#CategoricalClassification"></a>
             <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification-18"><a href="#CategoricalClassification-18"><span class="linenos"> 18</span></a><span class="k">class</span> <span class="nc">CategoricalClassification</span><span class="p">:</span>
 </span><span id="CategoricalClassification-19"><a href="#CategoricalClassification-19"><span class="linenos"> 19</span></a>
-</span><span id="CategoricalClassification-20"><a href="#CategoricalClassification-20"><span class="linenos"> 20</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-</span><span id="CategoricalClassification-21"><a href="#CategoricalClassification-21"><span class="linenos"> 21</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="CategoricalClassification-22"><a href="#CategoricalClassification-22"><span class="linenos"> 22</span></a>            <span class="s1">&#39;general&#39;</span><span class="p">:</span> <span class="p">{},</span>
-</span><span id="CategoricalClassification-23"><a href="#CategoricalClassification-23"><span class="linenos"> 23</span></a>            <span class="s1">&#39;combinations&#39;</span><span class="p">:</span> <span class="p">[],</span>
-</span><span id="CategoricalClassification-24"><a href="#CategoricalClassification-24"><span class="linenos"> 24</span></a>            <span class="s1">&#39;correlations&#39;</span><span class="p">:</span> <span class="p">[],</span>
-</span><span id="CategoricalClassification-25"><a href="#CategoricalClassification-25"><span class="linenos"> 25</span></a>            <span class="s1">&#39;duplicates&#39;</span><span class="p">:</span> <span class="p">[],</span>
-</span><span id="CategoricalClassification-26"><a href="#CategoricalClassification-26"><span class="linenos"> 26</span></a>            <span class="s1">&#39;labels&#39;</span><span class="p">:</span> <span class="p">[],</span>
-</span><span id="CategoricalClassification-27"><a href="#CategoricalClassification-27"><span class="linenos"> 27</span></a>            <span class="s1">&#39;noise&#39;</span><span class="p">:</span> <span class="p">[],</span>
-</span><span id="CategoricalClassification-28"><a href="#CategoricalClassification-28"><span class="linenos"> 28</span></a>        <span class="p">}</span>
-</span><span id="CategoricalClassification-29"><a href="#CategoricalClassification-29"><span class="linenos"> 29</span></a>
-</span><span id="CategoricalClassification-30"><a href="#CategoricalClassification-30"><span class="linenos"> 30</span></a>    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-</span><span id="CategoricalClassification-31"><a href="#CategoricalClassification-31"><span class="linenos"> 31</span></a>        <span class="k">return</span> <span class="sa">f</span><span class="s2">&quot;CategoricalClassification(dataset_info=</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="si">}</span><span class="s2">)&quot;</span>
-</span><span id="CategoricalClassification-32"><a href="#CategoricalClassification-32"><span class="linenos"> 32</span></a>
-</span><span id="CategoricalClassification-33"><a href="#CategoricalClassification-33"><span class="linenos"> 33</span></a>    <span class="k">def</span> <span class="nf">generate_data</span><span class="p">(</span>
-</span><span id="CategoricalClassification-34"><a href="#CategoricalClassification-34"><span class="linenos"> 34</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification-35"><a href="#CategoricalClassification-35"><span class="linenos"> 35</span></a>        <span class="n">n_features</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="CategoricalClassification-36"><a href="#CategoricalClassification-36"><span class="linenos"> 36</span></a>        <span class="n">n_samples</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="CategoricalClassification-37"><a href="#CategoricalClassification-37"><span class="linenos"> 37</span></a>        <span class="n">cardinality</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
-</span><span id="CategoricalClassification-38"><a href="#CategoricalClassification-38"><span class="linenos"> 38</span></a>        <span class="n">structure</span><span class="p">:</span> <span class="nb">list</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="CategoricalClassification-39"><a href="#CategoricalClassification-39"><span class="linenos"> 39</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="CategoricalClassification-40"><a href="#CategoricalClassification-40"><span class="linenos"> 40</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="CategoricalClassification-41"><a href="#CategoricalClassification-41"><span class="linenos"> 41</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
-</span><span id="CategoricalClassification-42"><a href="#CategoricalClassification-42"><span class="linenos"> 42</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
-</span><span id="CategoricalClassification-43"><a href="#CategoricalClassification-43"><span class="linenos"> 43</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
-</span><span id="CategoricalClassification-44"><a href="#CategoricalClassification-44"><span class="linenos"> 44</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="CategoricalClassification-45"><a href="#CategoricalClassification-45"><span class="linenos"> 45</span></a>
-</span><span id="CategoricalClassification-46"><a href="#CategoricalClassification-46"><span class="linenos"> 46</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-47"><a href="#CategoricalClassification-47"><span class="linenos"> 47</span></a><span class="sd">        Generates dataset based on given parameters</span>
-</span><span id="CategoricalClassification-48"><a href="#CategoricalClassification-48"><span class="linenos"> 48</span></a><span class="sd">        :param n_features: number of generated features</span>
-</span><span id="CategoricalClassification-49"><a href="#CategoricalClassification-49"><span class="linenos"> 49</span></a><span class="sd">        :param n_samples: number of generated samples</span>
-</span><span id="CategoricalClassification-50"><a href="#CategoricalClassification-50"><span class="linenos"> 50</span></a><span class="sd">        :param cardinality: default cardinality of the dataset</span>
-</span><span id="CategoricalClassification-51"><a href="#CategoricalClassification-51"><span class="linenos"> 51</span></a><span class="sd">        :param structure: structure of the dataset</span>
-</span><span id="CategoricalClassification-52"><a href="#CategoricalClassification-52"><span class="linenos"> 52</span></a><span class="sd">        :param ensure_rep: flag, ensures all given values represented</span>
-</span><span id="CategoricalClassification-53"><a href="#CategoricalClassification-53"><span class="linenos"> 53</span></a><span class="sd">        :param random_values: flag, enables random (integer) feature values from set [low, high]</span>
-</span><span id="CategoricalClassification-54"><a href="#CategoricalClassification-54"><span class="linenos"> 54</span></a><span class="sd">        :param low: sets lower bound of random feature values</span>
-</span><span id="CategoricalClassification-55"><a href="#CategoricalClassification-55"><span class="linenos"> 55</span></a><span class="sd">        :param high: sets high bound of random feature values</span>
-</span><span id="CategoricalClassification-56"><a href="#CategoricalClassification-56"><span class="linenos"> 56</span></a><span class="sd">        :param seed: sets seed of numpy random</span>
-</span><span id="CategoricalClassification-57"><a href="#CategoricalClassification-57"><span class="linenos"> 57</span></a><span class="sd">        :return: X, 2D dataset</span>
-</span><span id="CategoricalClassification-58"><a href="#CategoricalClassification-58"><span class="linenos"> 58</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-59"><a href="#CategoricalClassification-59"><span class="linenos"> 59</span></a>
-</span><span id="CategoricalClassification-60"><a href="#CategoricalClassification-60"><span class="linenos"> 60</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
-</span><span id="CategoricalClassification-61"><a href="#CategoricalClassification-61"><span class="linenos"> 61</span></a>            <span class="s1">&#39;general&#39;</span><span class="p">:</span> <span class="p">{</span>
-</span><span id="CategoricalClassification-62"><a href="#CategoricalClassification-62"><span class="linenos"> 62</span></a>                <span class="s1">&#39;n_features&#39;</span><span class="p">:</span> <span class="n">n_features</span><span class="p">,</span>
-</span><span id="CategoricalClassification-63"><a href="#CategoricalClassification-63"><span class="linenos"> 63</span></a>                <span class="s1">&#39;n_samples&#39;</span><span class="p">:</span> <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="CategoricalClassification-64"><a href="#CategoricalClassification-64"><span class="linenos"> 64</span></a>                <span class="s1">&#39;cardinality&#39;</span><span class="p">:</span> <span class="n">cardinality</span><span class="p">,</span>
-</span><span id="CategoricalClassification-65"><a href="#CategoricalClassification-65"><span class="linenos"> 65</span></a>                <span class="s1">&#39;structure&#39;</span><span class="p">:</span> <span class="n">structure</span><span class="p">,</span>
-</span><span id="CategoricalClassification-66"><a href="#CategoricalClassification-66"><span class="linenos"> 66</span></a>                <span class="s1">&#39;ensure_rep&#39;</span><span class="p">:</span> <span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="CategoricalClassification-67"><a href="#CategoricalClassification-67"><span class="linenos"> 67</span></a>                <span class="s1">&#39;seed&#39;</span><span class="p">:</span> <span class="n">seed</span><span class="p">,</span>
-</span><span id="CategoricalClassification-68"><a href="#CategoricalClassification-68"><span class="linenos"> 68</span></a>            <span class="p">},</span>
-</span><span id="CategoricalClassification-69"><a href="#CategoricalClassification-69"><span class="linenos"> 69</span></a>        <span class="p">})</span>
-</span><span id="CategoricalClassification-70"><a href="#CategoricalClassification-70"><span class="linenos"> 70</span></a>
-</span><span id="CategoricalClassification-71"><a href="#CategoricalClassification-71"><span class="linenos"> 71</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">seed</span><span class="p">(</span><span class="n">seed</span><span class="p">)</span>
-</span><span id="CategoricalClassification-72"><a href="#CategoricalClassification-72"><span class="linenos"> 72</span></a>        <span class="n">X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">empty</span><span class="p">([</span><span class="n">n_features</span><span class="p">,</span> <span class="n">n_samples</span><span class="p">])</span>
-</span><span id="CategoricalClassification-73"><a href="#CategoricalClassification-73"><span class="linenos"> 73</span></a>
-</span><span id="CategoricalClassification-74"><a href="#CategoricalClassification-74"><span class="linenos"> 74</span></a>        <span class="k">if</span> <span class="n">structure</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="CategoricalClassification-75"><a href="#CategoricalClassification-75"><span class="linenos"> 75</span></a>            <span class="c1"># No specific structure parameter passed</span>
-</span><span id="CategoricalClassification-76"><a href="#CategoricalClassification-76"><span class="linenos"> 76</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
-</span><span id="CategoricalClassification-77"><a href="#CategoricalClassification-77"><span class="linenos"> 77</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="CategoricalClassification-78"><a href="#CategoricalClassification-78"><span class="linenos"> 78</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="CategoricalClassification-79"><a href="#CategoricalClassification-79"><span class="linenos"> 79</span></a>                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
-</span><span id="CategoricalClassification-80"><a href="#CategoricalClassification-80"><span class="linenos"> 80</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="CategoricalClassification-81"><a href="#CategoricalClassification-81"><span class="linenos"> 81</span></a>                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="CategoricalClassification-82"><a href="#CategoricalClassification-82"><span class="linenos"> 82</span></a>                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="CategoricalClassification-83"><a href="#CategoricalClassification-83"><span class="linenos"> 83</span></a>                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="CategoricalClassification-84"><a href="#CategoricalClassification-84"><span class="linenos"> 84</span></a>                <span class="p">)</span>
-</span><span id="CategoricalClassification-85"><a href="#CategoricalClassification-85"><span class="linenos"> 85</span></a>                <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="CategoricalClassification-86"><a href="#CategoricalClassification-86"><span class="linenos"> 86</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-87"><a href="#CategoricalClassification-87"><span class="linenos"> 87</span></a>            <span class="c1"># Structure parameter passed, building based on structure</span>
-</span><span id="CategoricalClassification-88"><a href="#CategoricalClassification-88"><span class="linenos"> 88</span></a>            <span class="n">ix</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="CategoricalClassification-89"><a href="#CategoricalClassification-89"><span class="linenos"> 89</span></a>            <span class="k">for</span> <span class="n">data</span> <span class="ow">in</span> <span class="n">structure</span><span class="p">:</span>
-</span><span id="CategoricalClassification-90"><a href="#CategoricalClassification-90"><span class="linenos"> 90</span></a>                <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">data</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="CategoricalClassification-91"><a href="#CategoricalClassification-91"><span class="linenos"> 91</span></a>                    <span class="c1"># Data in structure is a tuple of (feature index (integer), feature attributes)</span>
-</span><span id="CategoricalClassification-92"><a href="#CategoricalClassification-92"><span class="linenos"> 92</span></a>                    <span class="n">feature_ix</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
-</span><span id="CategoricalClassification-93"><a href="#CategoricalClassification-93"><span class="linenos"> 93</span></a>
-</span><span id="CategoricalClassification-94"><a href="#CategoricalClassification-94"><span class="linenos"> 94</span></a>                    <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
-</span><span id="CategoricalClassification-95"><a href="#CategoricalClassification-95"><span class="linenos"> 95</span></a>                        <span class="c1"># Filling out the dataset up to column index feature_ix</span>
-</span><span id="CategoricalClassification-96"><a href="#CategoricalClassification-96"><span class="linenos"> 96</span></a>                        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
-</span><span id="CategoricalClassification-97"><a href="#CategoricalClassification-97"><span class="linenos"> 97</span></a>                            <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="CategoricalClassification-98"><a href="#CategoricalClassification-98"><span class="linenos"> 98</span></a>                                <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="CategoricalClassification-99"><a href="#CategoricalClassification-99"><span class="linenos"> 99</span></a>                                <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
-</span><span id="CategoricalClassification-100"><a href="#CategoricalClassification-100"><span class="linenos">100</span></a>                                <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="CategoricalClassification-101"><a href="#CategoricalClassification-101"><span class="linenos">101</span></a>                                <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="CategoricalClassification-102"><a href="#CategoricalClassification-102"><span class="linenos">102</span></a>                                <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="CategoricalClassification-103"><a href="#CategoricalClassification-103"><span class="linenos">103</span></a>                                <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="CategoricalClassification-104"><a href="#CategoricalClassification-104"><span class="linenos">104</span></a>                            <span class="p">)</span>
-</span><span id="CategoricalClassification-105"><a href="#CategoricalClassification-105"><span class="linenos">105</span></a>                            <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="CategoricalClassification-106"><a href="#CategoricalClassification-106"><span class="linenos">106</span></a>                            <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="CategoricalClassification-107"><a href="#CategoricalClassification-107"><span class="linenos">107</span></a>
-</span><span id="CategoricalClassification-108"><a href="#CategoricalClassification-108"><span class="linenos">108</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
-</span><span id="CategoricalClassification-109"><a href="#CategoricalClassification-109"><span class="linenos">109</span></a>                        <span class="n">feature_attributes</span><span class="p">,</span>
-</span><span id="CategoricalClassification-110"><a href="#CategoricalClassification-110"><span class="linenos">110</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="CategoricalClassification-111"><a href="#CategoricalClassification-111"><span class="linenos">111</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="CategoricalClassification-112"><a href="#CategoricalClassification-112"><span class="linenos">112</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="CategoricalClassification-113"><a href="#CategoricalClassification-113"><span class="linenos">113</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="CategoricalClassification-114"><a href="#CategoricalClassification-114"><span class="linenos">114</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="CategoricalClassification-115"><a href="#CategoricalClassification-115"><span class="linenos">115</span></a>                    <span class="p">)</span>
-</span><span id="CategoricalClassification-116"><a href="#CategoricalClassification-116"><span class="linenos">116</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="CategoricalClassification-117"><a href="#CategoricalClassification-117"><span class="linenos">117</span></a>                    <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="CategoricalClassification-118"><a href="#CategoricalClassification-118"><span class="linenos">118</span></a>
-</span><span id="CategoricalClassification-119"><a href="#CategoricalClassification-119"><span class="linenos">119</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-120"><a href="#CategoricalClassification-120"><span class="linenos">120</span></a>                    <span class="c1"># Data in structure is a tuple of (list of feature indexes, feature attributes)</span>
-</span><span id="CategoricalClassification-121"><a href="#CategoricalClassification-121"><span class="linenos">121</span></a>                    <span class="n">feature_ixs</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
-</span><span id="CategoricalClassification-122"><a href="#CategoricalClassification-122"><span class="linenos">122</span></a>
-</span><span id="CategoricalClassification-123"><a href="#CategoricalClassification-123"><span class="linenos">123</span></a>                    <span class="k">for</span> <span class="n">feature_ix</span> <span class="ow">in</span> <span class="n">feature_ixs</span><span class="p">:</span>
-</span><span id="CategoricalClassification-124"><a href="#CategoricalClassification-124"><span class="linenos">124</span></a>                        <span class="c1"># Filling out the dataset up to feature_ix</span>
-</span><span id="CategoricalClassification-125"><a href="#CategoricalClassification-125"><span class="linenos">125</span></a>                        <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
-</span><span id="CategoricalClassification-126"><a href="#CategoricalClassification-126"><span class="linenos">126</span></a>                            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
-</span><span id="CategoricalClassification-127"><a href="#CategoricalClassification-127"><span class="linenos">127</span></a>                                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="CategoricalClassification-128"><a href="#CategoricalClassification-128"><span class="linenos">128</span></a>                                    <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="CategoricalClassification-129"><a href="#CategoricalClassification-129"><span class="linenos">129</span></a>                                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
-</span><span id="CategoricalClassification-130"><a href="#CategoricalClassification-130"><span class="linenos">130</span></a>                                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="CategoricalClassification-131"><a href="#CategoricalClassification-131"><span class="linenos">131</span></a>                                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="CategoricalClassification-132"><a href="#CategoricalClassification-132"><span class="linenos">132</span></a>                                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="CategoricalClassification-133"><a href="#CategoricalClassification-133"><span class="linenos">133</span></a>                                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="CategoricalClassification-134"><a href="#CategoricalClassification-134"><span class="linenos">134</span></a>                                <span class="p">)</span>
-</span><span id="CategoricalClassification-135"><a href="#CategoricalClassification-135"><span class="linenos">135</span></a>                                <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="CategoricalClassification-136"><a href="#CategoricalClassification-136"><span class="linenos">136</span></a>                                <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="CategoricalClassification-137"><a href="#CategoricalClassification-137"><span class="linenos">137</span></a>
-</span><span id="CategoricalClassification-138"><a href="#CategoricalClassification-138"><span class="linenos">138</span></a>                        <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
-</span><span id="CategoricalClassification-139"><a href="#CategoricalClassification-139"><span class="linenos">139</span></a>                            <span class="n">feature_attributes</span><span class="p">,</span>
-</span><span id="CategoricalClassification-140"><a href="#CategoricalClassification-140"><span class="linenos">140</span></a>                            <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="CategoricalClassification-141"><a href="#CategoricalClassification-141"><span class="linenos">141</span></a>                            <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="CategoricalClassification-142"><a href="#CategoricalClassification-142"><span class="linenos">142</span></a>                            <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="CategoricalClassification-143"><a href="#CategoricalClassification-143"><span class="linenos">143</span></a>                            <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="CategoricalClassification-144"><a href="#CategoricalClassification-144"><span class="linenos">144</span></a>                            <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="CategoricalClassification-145"><a href="#CategoricalClassification-145"><span class="linenos">145</span></a>                        <span class="p">)</span>
-</span><span id="CategoricalClassification-146"><a href="#CategoricalClassification-146"><span class="linenos">146</span></a>
-</span><span id="CategoricalClassification-147"><a href="#CategoricalClassification-147"><span class="linenos">147</span></a>                        <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="CategoricalClassification-148"><a href="#CategoricalClassification-148"><span class="linenos">148</span></a>                        <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="CategoricalClassification-149"><a href="#CategoricalClassification-149"><span class="linenos">149</span></a>
-</span><span id="CategoricalClassification-150"><a href="#CategoricalClassification-150"><span class="linenos">150</span></a>            <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">n_features</span><span class="p">:</span>
-</span><span id="CategoricalClassification-151"><a href="#CategoricalClassification-151"><span class="linenos">151</span></a>                <span class="c1"># Fill out the rest of the dataset</span>
-</span><span id="CategoricalClassification-152"><a href="#CategoricalClassification-152"><span class="linenos">152</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">n_features</span><span class="p">):</span>
-</span><span id="CategoricalClassification-153"><a href="#CategoricalClassification-153"><span class="linenos">153</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="CategoricalClassification-154"><a href="#CategoricalClassification-154"><span class="linenos">154</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="CategoricalClassification-155"><a href="#CategoricalClassification-155"><span class="linenos">155</span></a>                        <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
-</span><span id="CategoricalClassification-156"><a href="#CategoricalClassification-156"><span class="linenos">156</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="CategoricalClassification-157"><a href="#CategoricalClassification-157"><span class="linenos">157</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="CategoricalClassification-158"><a href="#CategoricalClassification-158"><span class="linenos">158</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="CategoricalClassification-159"><a href="#CategoricalClassification-159"><span class="linenos">159</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="CategoricalClassification-160"><a href="#CategoricalClassification-160"><span class="linenos">160</span></a>                    <span class="p">)</span>
-</span><span id="CategoricalClassification-161"><a href="#CategoricalClassification-161"><span class="linenos">161</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="CategoricalClassification-162"><a href="#CategoricalClassification-162"><span class="linenos">162</span></a>
-</span><span id="CategoricalClassification-163"><a href="#CategoricalClassification-163"><span class="linenos">163</span></a>        <span class="k">return</span> <span class="n">X</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-20"><a href="#CategoricalClassification-20"><span class="linenos"> 20</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">):</span>
+</span><span id="CategoricalClassification-21"><a href="#CategoricalClassification-21"><span class="linenos"> 21</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">seed</span><span class="p">(</span><span class="n">seed</span><span class="p">)</span>
+</span><span id="CategoricalClassification-22"><a href="#CategoricalClassification-22"><span class="linenos"> 22</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="CategoricalClassification-23"><a href="#CategoricalClassification-23"><span class="linenos"> 23</span></a>            <span class="s1">&#39;general&#39;</span><span class="p">:</span> <span class="p">{},</span>
+</span><span id="CategoricalClassification-24"><a href="#CategoricalClassification-24"><span class="linenos"> 24</span></a>            <span class="s1">&#39;combinations&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="CategoricalClassification-25"><a href="#CategoricalClassification-25"><span class="linenos"> 25</span></a>            <span class="s1">&#39;correlations&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="CategoricalClassification-26"><a href="#CategoricalClassification-26"><span class="linenos"> 26</span></a>            <span class="s1">&#39;duplicates&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="CategoricalClassification-27"><a href="#CategoricalClassification-27"><span class="linenos"> 27</span></a>            <span class="s1">&#39;labels&#39;</span><span class="p">:</span> <span class="p">{},</span>
+</span><span id="CategoricalClassification-28"><a href="#CategoricalClassification-28"><span class="linenos"> 28</span></a>            <span class="s1">&#39;noise&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="CategoricalClassification-29"><a href="#CategoricalClassification-29"><span class="linenos"> 29</span></a>        <span class="p">}</span>
+</span><span id="CategoricalClassification-30"><a href="#CategoricalClassification-30"><span class="linenos"> 30</span></a>
+</span><span id="CategoricalClassification-31"><a href="#CategoricalClassification-31"><span class="linenos"> 31</span></a>    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="CategoricalClassification-32"><a href="#CategoricalClassification-32"><span class="linenos"> 32</span></a>        <span class="k">return</span> <span class="sa">f</span><span class="s2">&quot;CategoricalClassification(dataset_info=</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="si">}</span><span class="s2">)&quot;</span>
+</span><span id="CategoricalClassification-33"><a href="#CategoricalClassification-33"><span class="linenos"> 33</span></a>
+</span><span id="CategoricalClassification-34"><a href="#CategoricalClassification-34"><span class="linenos"> 34</span></a>    <span class="k">def</span> <span class="nf">generate_data</span><span class="p">(</span>
+</span><span id="CategoricalClassification-35"><a href="#CategoricalClassification-35"><span class="linenos"> 35</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-36"><a href="#CategoricalClassification-36"><span class="linenos"> 36</span></a>        <span class="n">n_features</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="CategoricalClassification-37"><a href="#CategoricalClassification-37"><span class="linenos"> 37</span></a>        <span class="n">n_samples</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="CategoricalClassification-38"><a href="#CategoricalClassification-38"><span class="linenos"> 38</span></a>        <span class="n">cardinality</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
+</span><span id="CategoricalClassification-39"><a href="#CategoricalClassification-39"><span class="linenos"> 39</span></a>        <span class="n">structure</span><span class="p">:</span> <span class="nb">list</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification-40"><a href="#CategoricalClassification-40"><span class="linenos"> 40</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-41"><a href="#CategoricalClassification-41"><span class="linenos"> 41</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-42"><a href="#CategoricalClassification-42"><span class="linenos"> 42</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
+</span><span id="CategoricalClassification-43"><a href="#CategoricalClassification-43"><span class="linenos"> 43</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
+</span><span id="CategoricalClassification-44"><a href="#CategoricalClassification-44"><span class="linenos"> 44</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
+</span><span id="CategoricalClassification-45"><a href="#CategoricalClassification-45"><span class="linenos"> 45</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-46"><a href="#CategoricalClassification-46"><span class="linenos"> 46</span></a>
+</span><span id="CategoricalClassification-47"><a href="#CategoricalClassification-47"><span class="linenos"> 47</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-48"><a href="#CategoricalClassification-48"><span class="linenos"> 48</span></a><span class="sd">        Generates dataset based on given parameters</span>
+</span><span id="CategoricalClassification-49"><a href="#CategoricalClassification-49"><span class="linenos"> 49</span></a><span class="sd">        :param n_features: number of generated features</span>
+</span><span id="CategoricalClassification-50"><a href="#CategoricalClassification-50"><span class="linenos"> 50</span></a><span class="sd">        :param n_samples: number of generated samples</span>
+</span><span id="CategoricalClassification-51"><a href="#CategoricalClassification-51"><span class="linenos"> 51</span></a><span class="sd">        :param cardinality: default cardinality of the dataset</span>
+</span><span id="CategoricalClassification-52"><a href="#CategoricalClassification-52"><span class="linenos"> 52</span></a><span class="sd">        :param structure: structure of the dataset</span>
+</span><span id="CategoricalClassification-53"><a href="#CategoricalClassification-53"><span class="linenos"> 53</span></a><span class="sd">        :param ensure_rep: flag, ensures all given values represented</span>
+</span><span id="CategoricalClassification-54"><a href="#CategoricalClassification-54"><span class="linenos"> 54</span></a><span class="sd">        :param random_values: flag, enables random (integer) feature values from set [low, high]</span>
+</span><span id="CategoricalClassification-55"><a href="#CategoricalClassification-55"><span class="linenos"> 55</span></a><span class="sd">        :param low: sets lower bound of random feature values</span>
+</span><span id="CategoricalClassification-56"><a href="#CategoricalClassification-56"><span class="linenos"> 56</span></a><span class="sd">        :param high: sets high bound of random feature values</span>
+</span><span id="CategoricalClassification-57"><a href="#CategoricalClassification-57"><span class="linenos"> 57</span></a><span class="sd">        :param seed: sets seed of numpy random</span>
+</span><span id="CategoricalClassification-58"><a href="#CategoricalClassification-58"><span class="linenos"> 58</span></a><span class="sd">        :return: X, 2D dataset</span>
+</span><span id="CategoricalClassification-59"><a href="#CategoricalClassification-59"><span class="linenos"> 59</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-60"><a href="#CategoricalClassification-60"><span class="linenos"> 60</span></a>
+</span><span id="CategoricalClassification-61"><a href="#CategoricalClassification-61"><span class="linenos"> 61</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="CategoricalClassification-62"><a href="#CategoricalClassification-62"><span class="linenos"> 62</span></a>            <span class="s1">&#39;general&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="CategoricalClassification-63"><a href="#CategoricalClassification-63"><span class="linenos"> 63</span></a>                <span class="s1">&#39;n_features&#39;</span><span class="p">:</span> <span class="n">n_features</span><span class="p">,</span>
+</span><span id="CategoricalClassification-64"><a href="#CategoricalClassification-64"><span class="linenos"> 64</span></a>                <span class="s1">&#39;n_samples&#39;</span><span class="p">:</span> <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-65"><a href="#CategoricalClassification-65"><span class="linenos"> 65</span></a>                <span class="s1">&#39;cardinality&#39;</span><span class="p">:</span> <span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification-66"><a href="#CategoricalClassification-66"><span class="linenos"> 66</span></a>                <span class="s1">&#39;structure&#39;</span><span class="p">:</span> <span class="n">structure</span><span class="p">,</span>
+</span><span id="CategoricalClassification-67"><a href="#CategoricalClassification-67"><span class="linenos"> 67</span></a>                <span class="s1">&#39;ensure_rep&#39;</span><span class="p">:</span> <span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-68"><a href="#CategoricalClassification-68"><span class="linenos"> 68</span></a>                <span class="s1">&#39;seed&#39;</span><span class="p">:</span> <span class="n">seed</span><span class="p">,</span>
+</span><span id="CategoricalClassification-69"><a href="#CategoricalClassification-69"><span class="linenos"> 69</span></a>            <span class="p">},</span>
+</span><span id="CategoricalClassification-70"><a href="#CategoricalClassification-70"><span class="linenos"> 70</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification-71"><a href="#CategoricalClassification-71"><span class="linenos"> 71</span></a>
+</span><span id="CategoricalClassification-72"><a href="#CategoricalClassification-72"><span class="linenos"> 72</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">seed</span><span class="p">(</span><span class="n">seed</span><span class="p">)</span>
+</span><span id="CategoricalClassification-73"><a href="#CategoricalClassification-73"><span class="linenos"> 73</span></a>        <span class="n">X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">empty</span><span class="p">([</span><span class="n">n_features</span><span class="p">,</span> <span class="n">n_samples</span><span class="p">])</span>
+</span><span id="CategoricalClassification-74"><a href="#CategoricalClassification-74"><span class="linenos"> 74</span></a>
+</span><span id="CategoricalClassification-75"><a href="#CategoricalClassification-75"><span class="linenos"> 75</span></a>        <span class="c1"># No specific structure parameter passed</span>
+</span><span id="CategoricalClassification-76"><a href="#CategoricalClassification-76"><span class="linenos"> 76</span></a>        <span class="k">if</span> <span class="n">structure</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification-77"><a href="#CategoricalClassification-77"><span class="linenos"> 77</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
+</span><span id="CategoricalClassification-78"><a href="#CategoricalClassification-78"><span class="linenos"> 78</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-79"><a href="#CategoricalClassification-79"><span class="linenos"> 79</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-80"><a href="#CategoricalClassification-80"><span class="linenos"> 80</span></a>                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification-81"><a href="#CategoricalClassification-81"><span class="linenos"> 81</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-82"><a href="#CategoricalClassification-82"><span class="linenos"> 82</span></a>                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification-83"><a href="#CategoricalClassification-83"><span class="linenos"> 83</span></a>                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification-84"><a href="#CategoricalClassification-84"><span class="linenos"> 84</span></a>                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification-85"><a href="#CategoricalClassification-85"><span class="linenos"> 85</span></a>                <span class="p">)</span>
+</span><span id="CategoricalClassification-86"><a href="#CategoricalClassification-86"><span class="linenos"> 86</span></a>                <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification-87"><a href="#CategoricalClassification-87"><span class="linenos"> 87</span></a>        <span class="c1"># Structure parameter passed, building based on structure</span>
+</span><span id="CategoricalClassification-88"><a href="#CategoricalClassification-88"><span class="linenos"> 88</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-89"><a href="#CategoricalClassification-89"><span class="linenos"> 89</span></a>            <span class="n">ix</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="CategoricalClassification-90"><a href="#CategoricalClassification-90"><span class="linenos"> 90</span></a>            <span class="k">for</span> <span class="n">data</span> <span class="ow">in</span> <span class="n">structure</span><span class="p">:</span>
+</span><span id="CategoricalClassification-91"><a href="#CategoricalClassification-91"><span class="linenos"> 91</span></a>
+</span><span id="CategoricalClassification-92"><a href="#CategoricalClassification-92"><span class="linenos"> 92</span></a>                <span class="c1"># Data in structure is a tuple of (feature index (integer), feature attributes)</span>
+</span><span id="CategoricalClassification-93"><a href="#CategoricalClassification-93"><span class="linenos"> 93</span></a>                <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">data</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-94"><a href="#CategoricalClassification-94"><span class="linenos"> 94</span></a>                    <span class="n">feature_ix</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
+</span><span id="CategoricalClassification-95"><a href="#CategoricalClassification-95"><span class="linenos"> 95</span></a>
+</span><span id="CategoricalClassification-96"><a href="#CategoricalClassification-96"><span class="linenos"> 96</span></a>                    <span class="c1"># Filling out the dataset up to column index feature_ix</span>
+</span><span id="CategoricalClassification-97"><a href="#CategoricalClassification-97"><span class="linenos"> 97</span></a>                    <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
+</span><span id="CategoricalClassification-98"><a href="#CategoricalClassification-98"><span class="linenos"> 98</span></a>                        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
+</span><span id="CategoricalClassification-99"><a href="#CategoricalClassification-99"><span class="linenos"> 99</span></a>                            <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-100"><a href="#CategoricalClassification-100"><span class="linenos">100</span></a>                                <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-101"><a href="#CategoricalClassification-101"><span class="linenos">101</span></a>                                <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification-102"><a href="#CategoricalClassification-102"><span class="linenos">102</span></a>                                <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-103"><a href="#CategoricalClassification-103"><span class="linenos">103</span></a>                                <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification-104"><a href="#CategoricalClassification-104"><span class="linenos">104</span></a>                                <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification-105"><a href="#CategoricalClassification-105"><span class="linenos">105</span></a>                                <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification-106"><a href="#CategoricalClassification-106"><span class="linenos">106</span></a>                            <span class="p">)</span>
+</span><span id="CategoricalClassification-107"><a href="#CategoricalClassification-107"><span class="linenos">107</span></a>                            <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification-108"><a href="#CategoricalClassification-108"><span class="linenos">108</span></a>                            <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification-109"><a href="#CategoricalClassification-109"><span class="linenos">109</span></a>
+</span><span id="CategoricalClassification-110"><a href="#CategoricalClassification-110"><span class="linenos">110</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-111"><a href="#CategoricalClassification-111"><span class="linenos">111</span></a>                        <span class="n">feature_attributes</span><span class="p">,</span>
+</span><span id="CategoricalClassification-112"><a href="#CategoricalClassification-112"><span class="linenos">112</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-113"><a href="#CategoricalClassification-113"><span class="linenos">113</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-114"><a href="#CategoricalClassification-114"><span class="linenos">114</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification-115"><a href="#CategoricalClassification-115"><span class="linenos">115</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification-116"><a href="#CategoricalClassification-116"><span class="linenos">116</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification-117"><a href="#CategoricalClassification-117"><span class="linenos">117</span></a>                    <span class="p">)</span>
+</span><span id="CategoricalClassification-118"><a href="#CategoricalClassification-118"><span class="linenos">118</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification-119"><a href="#CategoricalClassification-119"><span class="linenos">119</span></a>                    <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification-120"><a href="#CategoricalClassification-120"><span class="linenos">120</span></a>
+</span><span id="CategoricalClassification-121"><a href="#CategoricalClassification-121"><span class="linenos">121</span></a>                <span class="c1"># Data in structure is a tuple of (list of feature indexes, feature attributes)</span>
+</span><span id="CategoricalClassification-122"><a href="#CategoricalClassification-122"><span class="linenos">122</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-123"><a href="#CategoricalClassification-123"><span class="linenos">123</span></a>                    <span class="n">feature_ixs</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
+</span><span id="CategoricalClassification-124"><a href="#CategoricalClassification-124"><span class="linenos">124</span></a>
+</span><span id="CategoricalClassification-125"><a href="#CategoricalClassification-125"><span class="linenos">125</span></a>                    <span class="c1"># Filling out the dataset up to feature_ix</span>
+</span><span id="CategoricalClassification-126"><a href="#CategoricalClassification-126"><span class="linenos">126</span></a>                    <span class="k">for</span> <span class="n">feature_ix</span> <span class="ow">in</span> <span class="n">feature_ixs</span><span class="p">:</span>
+</span><span id="CategoricalClassification-127"><a href="#CategoricalClassification-127"><span class="linenos">127</span></a>                        <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
+</span><span id="CategoricalClassification-128"><a href="#CategoricalClassification-128"><span class="linenos">128</span></a>                            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
+</span><span id="CategoricalClassification-129"><a href="#CategoricalClassification-129"><span class="linenos">129</span></a>                                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-130"><a href="#CategoricalClassification-130"><span class="linenos">130</span></a>                                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-131"><a href="#CategoricalClassification-131"><span class="linenos">131</span></a>                                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification-132"><a href="#CategoricalClassification-132"><span class="linenos">132</span></a>                                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-133"><a href="#CategoricalClassification-133"><span class="linenos">133</span></a>                                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification-134"><a href="#CategoricalClassification-134"><span class="linenos">134</span></a>                                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification-135"><a href="#CategoricalClassification-135"><span class="linenos">135</span></a>                                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification-136"><a href="#CategoricalClassification-136"><span class="linenos">136</span></a>                                <span class="p">)</span>
+</span><span id="CategoricalClassification-137"><a href="#CategoricalClassification-137"><span class="linenos">137</span></a>                                <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification-138"><a href="#CategoricalClassification-138"><span class="linenos">138</span></a>                                <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification-139"><a href="#CategoricalClassification-139"><span class="linenos">139</span></a>
+</span><span id="CategoricalClassification-140"><a href="#CategoricalClassification-140"><span class="linenos">140</span></a>                        <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-141"><a href="#CategoricalClassification-141"><span class="linenos">141</span></a>                            <span class="n">feature_attributes</span><span class="p">,</span>
+</span><span id="CategoricalClassification-142"><a href="#CategoricalClassification-142"><span class="linenos">142</span></a>                            <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-143"><a href="#CategoricalClassification-143"><span class="linenos">143</span></a>                            <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-144"><a href="#CategoricalClassification-144"><span class="linenos">144</span></a>                            <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification-145"><a href="#CategoricalClassification-145"><span class="linenos">145</span></a>                            <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification-146"><a href="#CategoricalClassification-146"><span class="linenos">146</span></a>                            <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification-147"><a href="#CategoricalClassification-147"><span class="linenos">147</span></a>                        <span class="p">)</span>
+</span><span id="CategoricalClassification-148"><a href="#CategoricalClassification-148"><span class="linenos">148</span></a>
+</span><span id="CategoricalClassification-149"><a href="#CategoricalClassification-149"><span class="linenos">149</span></a>                        <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification-150"><a href="#CategoricalClassification-150"><span class="linenos">150</span></a>                        <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification-151"><a href="#CategoricalClassification-151"><span class="linenos">151</span></a>
+</span><span id="CategoricalClassification-152"><a href="#CategoricalClassification-152"><span class="linenos">152</span></a>            <span class="c1"># Fill out the rest of the dataset</span>
+</span><span id="CategoricalClassification-153"><a href="#CategoricalClassification-153"><span class="linenos">153</span></a>            <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">n_features</span><span class="p">:</span>
+</span><span id="CategoricalClassification-154"><a href="#CategoricalClassification-154"><span class="linenos">154</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">n_features</span><span class="p">):</span>
+</span><span id="CategoricalClassification-155"><a href="#CategoricalClassification-155"><span class="linenos">155</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-156"><a href="#CategoricalClassification-156"><span class="linenos">156</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-157"><a href="#CategoricalClassification-157"><span class="linenos">157</span></a>                        <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification-158"><a href="#CategoricalClassification-158"><span class="linenos">158</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-159"><a href="#CategoricalClassification-159"><span class="linenos">159</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification-160"><a href="#CategoricalClassification-160"><span class="linenos">160</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification-161"><a href="#CategoricalClassification-161"><span class="linenos">161</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification-162"><a href="#CategoricalClassification-162"><span class="linenos">162</span></a>                    <span class="p">)</span>
+</span><span id="CategoricalClassification-163"><a href="#CategoricalClassification-163"><span class="linenos">163</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
 </span><span id="CategoricalClassification-164"><a href="#CategoricalClassification-164"><span class="linenos">164</span></a>
-</span><span id="CategoricalClassification-165"><a href="#CategoricalClassification-165"><span class="linenos">165</span></a>    <span class="k">def</span> <span class="nf">_configure_generate_feature</span><span class="p">(</span>
-</span><span id="CategoricalClassification-166"><a href="#CategoricalClassification-166"><span class="linenos">166</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification-167"><a href="#CategoricalClassification-167"><span class="linenos">167</span></a>        <span class="n">feature_attributes</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">list</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification-168"><a href="#CategoricalClassification-168"><span class="linenos">168</span></a>        <span class="n">n_samples</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="CategoricalClassification-169"><a href="#CategoricalClassification-169"><span class="linenos">169</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="CategoricalClassification-170"><a href="#CategoricalClassification-170"><span class="linenos">170</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="CategoricalClassification-171"><a href="#CategoricalClassification-171"><span class="linenos">171</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
-</span><span id="CategoricalClassification-172"><a href="#CategoricalClassification-172"><span class="linenos">172</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
-</span><span id="CategoricalClassification-173"><a href="#CategoricalClassification-173"><span class="linenos">173</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="CategoricalClassification-174"><a href="#CategoricalClassification-174"><span class="linenos">174</span></a>
-</span><span id="CategoricalClassification-175"><a href="#CategoricalClassification-175"><span class="linenos">175</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-176"><a href="#CategoricalClassification-176"><span class="linenos">176</span></a><span class="sd">        Helper function, calls _generate_feature with appropriate parameters based on feature_attributes</span>
-</span><span id="CategoricalClassification-177"><a href="#CategoricalClassification-177"><span class="linenos">177</span></a><span class="sd">        :param feature_attributes: either integer (cardinality) or list of feature attributes</span>
-</span><span id="CategoricalClassification-178"><a href="#CategoricalClassification-178"><span class="linenos">178</span></a><span class="sd">        :param n_samples: number of samples in dataset</span>
-</span><span id="CategoricalClassification-179"><a href="#CategoricalClassification-179"><span class="linenos">179</span></a><span class="sd">        :param ensure_rep: ensures all values are represented at least once in the feature vector</span>
-</span><span id="CategoricalClassification-180"><a href="#CategoricalClassification-180"><span class="linenos">180</span></a><span class="sd">        :param random_values: randomly picked values for vec if true, otherwise values range from [low, cardinality] with by 1</span>
-</span><span id="CategoricalClassification-181"><a href="#CategoricalClassification-181"><span class="linenos">181</span></a><span class="sd">        :param low: lower bound of random feature vector values</span>
-</span><span id="CategoricalClassification-182"><a href="#CategoricalClassification-182"><span class="linenos">182</span></a><span class="sd">        :param high: upper bound of random feature vector values</span>
-</span><span id="CategoricalClassification-183"><a href="#CategoricalClassification-183"><span class="linenos">183</span></a><span class="sd">        :return: feature vector</span>
-</span><span id="CategoricalClassification-184"><a href="#CategoricalClassification-184"><span class="linenos">184</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-185"><a href="#CategoricalClassification-185"><span class="linenos">185</span></a>
-</span><span id="CategoricalClassification-186"><a href="#CategoricalClassification-186"><span class="linenos">186</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_attributes</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="CategoricalClassification-187"><a href="#CategoricalClassification-187"><span class="linenos">187</span></a>            <span class="c1"># feature_cardinality is just an integer, generate feature either with random values or</span>
-</span><span id="CategoricalClassification-188"><a href="#CategoricalClassification-188"><span class="linenos">188</span></a>            <span class="c1"># [low, low+cardinality]</span>
-</span><span id="CategoricalClassification-189"><a href="#CategoricalClassification-189"><span class="linenos">189</span></a>            <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="CategoricalClassification-190"><a href="#CategoricalClassification-190"><span class="linenos">190</span></a>                <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="CategoricalClassification-191"><a href="#CategoricalClassification-191"><span class="linenos">191</span></a>                <span class="n">cardinality</span><span class="o">=</span><span class="n">feature_attributes</span><span class="p">,</span>
-</span><span id="CategoricalClassification-192"><a href="#CategoricalClassification-192"><span class="linenos">192</span></a>                <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="CategoricalClassification-193"><a href="#CategoricalClassification-193"><span class="linenos">193</span></a>                <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="CategoricalClassification-194"><a href="#CategoricalClassification-194"><span class="linenos">194</span></a>                <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="CategoricalClassification-195"><a href="#CategoricalClassification-195"><span class="linenos">195</span></a>                <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="CategoricalClassification-196"><a href="#CategoricalClassification-196"><span class="linenos">196</span></a>            <span class="p">)</span>
-</span><span id="CategoricalClassification-197"><a href="#CategoricalClassification-197"><span class="linenos">197</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-198"><a href="#CategoricalClassification-198"><span class="linenos">198</span></a>            <span class="c1"># feature_cardinality is a list of [value_domain, value_frequencies]</span>
-</span><span id="CategoricalClassification-199"><a href="#CategoricalClassification-199"><span class="linenos">199</span></a>            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_attributes</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="CategoricalClassification-200"><a href="#CategoricalClassification-200"><span class="linenos">200</span></a>                <span class="n">value_domain</span><span class="p">,</span> <span class="n">value_frequencies</span> <span class="o">=</span> <span class="n">feature_attributes</span>
-</span><span id="CategoricalClassification-201"><a href="#CategoricalClassification-201"><span class="linenos">201</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="CategoricalClassification-202"><a href="#CategoricalClassification-202"><span class="linenos">202</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="CategoricalClassification-203"><a href="#CategoricalClassification-203"><span class="linenos">203</span></a>                    <span class="n">vec</span><span class="o">=</span><span class="n">value_domain</span><span class="p">,</span>
-</span><span id="CategoricalClassification-204"><a href="#CategoricalClassification-204"><span class="linenos">204</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="CategoricalClassification-205"><a href="#CategoricalClassification-205"><span class="linenos">205</span></a>                    <span class="n">p</span><span class="o">=</span><span class="n">value_frequencies</span><span class="p">,</span>
-</span><span id="CategoricalClassification-206"><a href="#CategoricalClassification-206"><span class="linenos">206</span></a>                <span class="p">)</span>
-</span><span id="CategoricalClassification-207"><a href="#CategoricalClassification-207"><span class="linenos">207</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-208"><a href="#CategoricalClassification-208"><span class="linenos">208</span></a>                <span class="c1"># feature_cardinality is value_domain (list of values for feature)</span>
-</span><span id="CategoricalClassification-209"><a href="#CategoricalClassification-209"><span class="linenos">209</span></a>                <span class="n">value_domain</span> <span class="o">=</span> <span class="n">feature_attributes</span>
-</span><span id="CategoricalClassification-210"><a href="#CategoricalClassification-210"><span class="linenos">210</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="CategoricalClassification-211"><a href="#CategoricalClassification-211"><span class="linenos">211</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="CategoricalClassification-212"><a href="#CategoricalClassification-212"><span class="linenos">212</span></a>                    <span class="n">vec</span><span class="o">=</span><span class="n">value_domain</span><span class="p">,</span>
-</span><span id="CategoricalClassification-213"><a href="#CategoricalClassification-213"><span class="linenos">213</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="CategoricalClassification-214"><a href="#CategoricalClassification-214"><span class="linenos">214</span></a>                <span class="p">)</span>
-</span><span id="CategoricalClassification-215"><a href="#CategoricalClassification-215"><span class="linenos">215</span></a>
-</span><span id="CategoricalClassification-216"><a href="#CategoricalClassification-216"><span class="linenos">216</span></a>        <span class="k">return</span> <span class="n">x</span>
+</span><span id="CategoricalClassification-165"><a href="#CategoricalClassification-165"><span class="linenos">165</span></a>        <span class="k">return</span> <span class="n">X</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-166"><a href="#CategoricalClassification-166"><span class="linenos">166</span></a>
+</span><span id="CategoricalClassification-167"><a href="#CategoricalClassification-167"><span class="linenos">167</span></a>    <span class="k">def</span> <span class="nf">_configure_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-168"><a href="#CategoricalClassification-168"><span class="linenos">168</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-169"><a href="#CategoricalClassification-169"><span class="linenos">169</span></a>        <span class="n">feature_attributes</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">list</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-170"><a href="#CategoricalClassification-170"><span class="linenos">170</span></a>        <span class="n">n_samples</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="CategoricalClassification-171"><a href="#CategoricalClassification-171"><span class="linenos">171</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-172"><a href="#CategoricalClassification-172"><span class="linenos">172</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-173"><a href="#CategoricalClassification-173"><span class="linenos">173</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
+</span><span id="CategoricalClassification-174"><a href="#CategoricalClassification-174"><span class="linenos">174</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
+</span><span id="CategoricalClassification-175"><a href="#CategoricalClassification-175"><span class="linenos">175</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-176"><a href="#CategoricalClassification-176"><span class="linenos">176</span></a>
+</span><span id="CategoricalClassification-177"><a href="#CategoricalClassification-177"><span class="linenos">177</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-178"><a href="#CategoricalClassification-178"><span class="linenos">178</span></a><span class="sd">        Helper function, calls _generate_feature with appropriate parameters based on feature_attributes</span>
+</span><span id="CategoricalClassification-179"><a href="#CategoricalClassification-179"><span class="linenos">179</span></a><span class="sd">        :param feature_attributes: either integer (cardinality) or list of feature attributes</span>
+</span><span id="CategoricalClassification-180"><a href="#CategoricalClassification-180"><span class="linenos">180</span></a><span class="sd">        :param n_samples: number of samples in dataset</span>
+</span><span id="CategoricalClassification-181"><a href="#CategoricalClassification-181"><span class="linenos">181</span></a><span class="sd">        :param ensure_rep: ensures all values are represented at least once in the feature vector</span>
+</span><span id="CategoricalClassification-182"><a href="#CategoricalClassification-182"><span class="linenos">182</span></a><span class="sd">        :param random_values: randomly picked values for vec if true, otherwise values range from [low, cardinality] with by 1</span>
+</span><span id="CategoricalClassification-183"><a href="#CategoricalClassification-183"><span class="linenos">183</span></a><span class="sd">        :param low: lower bound of random feature vector values</span>
+</span><span id="CategoricalClassification-184"><a href="#CategoricalClassification-184"><span class="linenos">184</span></a><span class="sd">        :param high: upper bound of random feature vector values</span>
+</span><span id="CategoricalClassification-185"><a href="#CategoricalClassification-185"><span class="linenos">185</span></a><span class="sd">        :return: feature vector</span>
+</span><span id="CategoricalClassification-186"><a href="#CategoricalClassification-186"><span class="linenos">186</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-187"><a href="#CategoricalClassification-187"><span class="linenos">187</span></a>
+</span><span id="CategoricalClassification-188"><a href="#CategoricalClassification-188"><span class="linenos">188</span></a>        <span class="c1"># feature_cardinality is just an integer, generate feature either with random values or</span>
+</span><span id="CategoricalClassification-189"><a href="#CategoricalClassification-189"><span class="linenos">189</span></a>        <span class="c1"># [low, low+cardinality]</span>
+</span><span id="CategoricalClassification-190"><a href="#CategoricalClassification-190"><span class="linenos">190</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_attributes</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-191"><a href="#CategoricalClassification-191"><span class="linenos">191</span></a>            <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-192"><a href="#CategoricalClassification-192"><span class="linenos">192</span></a>                <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-193"><a href="#CategoricalClassification-193"><span class="linenos">193</span></a>                <span class="n">cardinality</span><span class="o">=</span><span class="n">feature_attributes</span><span class="p">,</span>
+</span><span id="CategoricalClassification-194"><a href="#CategoricalClassification-194"><span class="linenos">194</span></a>                <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-195"><a href="#CategoricalClassification-195"><span class="linenos">195</span></a>                <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification-196"><a href="#CategoricalClassification-196"><span class="linenos">196</span></a>                <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification-197"><a href="#CategoricalClassification-197"><span class="linenos">197</span></a>                <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification-198"><a href="#CategoricalClassification-198"><span class="linenos">198</span></a>            <span class="p">)</span>
+</span><span id="CategoricalClassification-199"><a href="#CategoricalClassification-199"><span class="linenos">199</span></a>        <span class="c1"># feature_cardinality is a list of [value_domain, value_frequencies]</span>
+</span><span id="CategoricalClassification-200"><a href="#CategoricalClassification-200"><span class="linenos">200</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-201"><a href="#CategoricalClassification-201"><span class="linenos">201</span></a>            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_attributes</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-202"><a href="#CategoricalClassification-202"><span class="linenos">202</span></a>                <span class="n">value_domain</span><span class="p">,</span> <span class="n">value_frequencies</span> <span class="o">=</span> <span class="n">feature_attributes</span>
+</span><span id="CategoricalClassification-203"><a href="#CategoricalClassification-203"><span class="linenos">203</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-204"><a href="#CategoricalClassification-204"><span class="linenos">204</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-205"><a href="#CategoricalClassification-205"><span class="linenos">205</span></a>                    <span class="n">vec</span><span class="o">=</span><span class="n">value_domain</span><span class="p">,</span>
+</span><span id="CategoricalClassification-206"><a href="#CategoricalClassification-206"><span class="linenos">206</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-207"><a href="#CategoricalClassification-207"><span class="linenos">207</span></a>                    <span class="n">p</span><span class="o">=</span><span class="n">value_frequencies</span><span class="p">,</span>
+</span><span id="CategoricalClassification-208"><a href="#CategoricalClassification-208"><span class="linenos">208</span></a>                <span class="p">)</span>
+</span><span id="CategoricalClassification-209"><a href="#CategoricalClassification-209"><span class="linenos">209</span></a>            <span class="c1"># feature_cardinality is value_domain (list of values for feature)</span>
+</span><span id="CategoricalClassification-210"><a href="#CategoricalClassification-210"><span class="linenos">210</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-211"><a href="#CategoricalClassification-211"><span class="linenos">211</span></a>                <span class="n">value_domain</span> <span class="o">=</span> <span class="n">feature_attributes</span>
+</span><span id="CategoricalClassification-212"><a href="#CategoricalClassification-212"><span class="linenos">212</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-213"><a href="#CategoricalClassification-213"><span class="linenos">213</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification-214"><a href="#CategoricalClassification-214"><span class="linenos">214</span></a>                    <span class="n">vec</span><span class="o">=</span><span class="n">value_domain</span><span class="p">,</span>
+</span><span id="CategoricalClassification-215"><a href="#CategoricalClassification-215"><span class="linenos">215</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification-216"><a href="#CategoricalClassification-216"><span class="linenos">216</span></a>                <span class="p">)</span>
 </span><span id="CategoricalClassification-217"><a href="#CategoricalClassification-217"><span class="linenos">217</span></a>
-</span><span id="CategoricalClassification-218"><a href="#CategoricalClassification-218"><span class="linenos">218</span></a>    <span class="k">def</span> <span class="nf">_generate_feature</span><span class="p">(</span>
-</span><span id="CategoricalClassification-219"><a href="#CategoricalClassification-219"><span class="linenos">219</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification-220"><a href="#CategoricalClassification-220"><span class="linenos">220</span></a>        <span class="n">size</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="CategoricalClassification-221"><a href="#CategoricalClassification-221"><span class="linenos">221</span></a>        <span class="n">vec</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="CategoricalClassification-222"><a href="#CategoricalClassification-222"><span class="linenos">222</span></a>        <span class="n">cardinality</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
-</span><span id="CategoricalClassification-223"><a href="#CategoricalClassification-223"><span class="linenos">223</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="CategoricalClassification-224"><a href="#CategoricalClassification-224"><span class="linenos">224</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="CategoricalClassification-225"><a href="#CategoricalClassification-225"><span class="linenos">225</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
-</span><span id="CategoricalClassification-226"><a href="#CategoricalClassification-226"><span class="linenos">226</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
-</span><span id="CategoricalClassification-227"><a href="#CategoricalClassification-227"><span class="linenos">227</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="CategoricalClassification-228"><a href="#CategoricalClassification-228"><span class="linenos">228</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="CategoricalClassification-229"><a href="#CategoricalClassification-229"><span class="linenos">229</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-230"><a href="#CategoricalClassification-230"><span class="linenos">230</span></a><span class="sd">        Generates feature vector of length size. Default probability density distribution is approximately normal, centred around a randomly picked value.</span>
-</span><span id="CategoricalClassification-231"><a href="#CategoricalClassification-231"><span class="linenos">231</span></a><span class="sd">        :param vec: list of feature values</span>
-</span><span id="CategoricalClassification-232"><a href="#CategoricalClassification-232"><span class="linenos">232</span></a><span class="sd">        :param cardinality: single value cardinality</span>
-</span><span id="CategoricalClassification-233"><a href="#CategoricalClassification-233"><span class="linenos">233</span></a><span class="sd">        :param size: length of feature vector</span>
-</span><span id="CategoricalClassification-234"><a href="#CategoricalClassification-234"><span class="linenos">234</span></a><span class="sd">        :param ensure_rep: ensures all values are represented at least once in the feature vector</span>
-</span><span id="CategoricalClassification-235"><a href="#CategoricalClassification-235"><span class="linenos">235</span></a><span class="sd">        :param random_values: randomly picked values for vec if true, otherwise values range from [low, cardinality] with by 1</span>
-</span><span id="CategoricalClassification-236"><a href="#CategoricalClassification-236"><span class="linenos">236</span></a><span class="sd">        :param low: lower bound of random feature vector values</span>
-</span><span id="CategoricalClassification-237"><a href="#CategoricalClassification-237"><span class="linenos">237</span></a><span class="sd">        :param high: upper bound of random feature vector values</span>
-</span><span id="CategoricalClassification-238"><a href="#CategoricalClassification-238"><span class="linenos">238</span></a><span class="sd">        :param p: list of probabilities of each value</span>
-</span><span id="CategoricalClassification-239"><a href="#CategoricalClassification-239"><span class="linenos">239</span></a><span class="sd">        :return: feature vector x</span>
-</span><span id="CategoricalClassification-240"><a href="#CategoricalClassification-240"><span class="linenos">240</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-241"><a href="#CategoricalClassification-241"><span class="linenos">241</span></a>
-</span><span id="CategoricalClassification-242"><a href="#CategoricalClassification-242"><span class="linenos">242</span></a>        <span class="k">if</span> <span class="n">vec</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="CategoricalClassification-243"><a href="#CategoricalClassification-243"><span class="linenos">243</span></a>            <span class="k">if</span> <span class="n">random_values</span><span class="p">:</span>
-</span><span id="CategoricalClassification-244"><a href="#CategoricalClassification-244"><span class="linenos">244</span></a>                <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="n">low</span><span class="p">,</span> <span class="n">high</span> <span class="o">+</span> <span class="mi">1</span><span class="p">),</span> <span class="n">cardinality</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-</span><span id="CategoricalClassification-245"><a href="#CategoricalClassification-245"><span class="linenos">245</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-246"><a href="#CategoricalClassification-246"><span class="linenos">246</span></a>                <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">low</span><span class="p">,</span> <span class="n">low</span> <span class="o">+</span> <span class="n">cardinality</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="CategoricalClassification-247"><a href="#CategoricalClassification-247"><span class="linenos">247</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-248"><a href="#CategoricalClassification-248"><span class="linenos">248</span></a>            <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">vec</span><span class="p">)</span>
-</span><span id="CategoricalClassification-249"><a href="#CategoricalClassification-249"><span class="linenos">249</span></a>
-</span><span id="CategoricalClassification-250"><a href="#CategoricalClassification-250"><span class="linenos">250</span></a>        <span class="k">if</span> <span class="n">p</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="CategoricalClassification-251"><a href="#CategoricalClassification-251"><span class="linenos">251</span></a>            <span class="n">v_shift</span> <span class="o">=</span> <span class="n">vec</span> <span class="o">-</span> <span class="n">vec</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">))]</span>
-</span><span id="CategoricalClassification-252"><a href="#CategoricalClassification-252"><span class="linenos">252</span></a>            <span class="n">p</span> <span class="o">=</span> <span class="n">norm</span><span class="o">.</span><span class="n">pdf</span><span class="p">(</span><span class="n">v_shift</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="mi">3</span><span class="p">)</span>
-</span><span id="CategoricalClassification-253"><a href="#CategoricalClassification-253"><span class="linenos">253</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-254"><a href="#CategoricalClassification-254"><span class="linenos">254</span></a>            <span class="n">p</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">p</span><span class="p">)</span>
-</span><span id="CategoricalClassification-255"><a href="#CategoricalClassification-255"><span class="linenos">255</span></a>
-</span><span id="CategoricalClassification-256"><a href="#CategoricalClassification-256"><span class="linenos">256</span></a>        <span class="n">p</span> <span class="o">=</span> <span class="n">p</span> <span class="o">/</span> <span class="n">p</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span>
+</span><span id="CategoricalClassification-218"><a href="#CategoricalClassification-218"><span class="linenos">218</span></a>        <span class="k">return</span> <span class="n">x</span>
+</span><span id="CategoricalClassification-219"><a href="#CategoricalClassification-219"><span class="linenos">219</span></a>
+</span><span id="CategoricalClassification-220"><a href="#CategoricalClassification-220"><span class="linenos">220</span></a>    <span class="k">def</span> <span class="nf">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification-221"><a href="#CategoricalClassification-221"><span class="linenos">221</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-222"><a href="#CategoricalClassification-222"><span class="linenos">222</span></a>        <span class="n">size</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="CategoricalClassification-223"><a href="#CategoricalClassification-223"><span class="linenos">223</span></a>        <span class="n">vec</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification-224"><a href="#CategoricalClassification-224"><span class="linenos">224</span></a>        <span class="n">cardinality</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
+</span><span id="CategoricalClassification-225"><a href="#CategoricalClassification-225"><span class="linenos">225</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-226"><a href="#CategoricalClassification-226"><span class="linenos">226</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-227"><a href="#CategoricalClassification-227"><span class="linenos">227</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
+</span><span id="CategoricalClassification-228"><a href="#CategoricalClassification-228"><span class="linenos">228</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
+</span><span id="CategoricalClassification-229"><a href="#CategoricalClassification-229"><span class="linenos">229</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification-230"><a href="#CategoricalClassification-230"><span class="linenos">230</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-231"><a href="#CategoricalClassification-231"><span class="linenos">231</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-232"><a href="#CategoricalClassification-232"><span class="linenos">232</span></a><span class="sd">        Generates feature vector of length size. Default probability density distribution is approximately normal, centred around a randomly picked value.</span>
+</span><span id="CategoricalClassification-233"><a href="#CategoricalClassification-233"><span class="linenos">233</span></a><span class="sd">        :param vec: list of feature values</span>
+</span><span id="CategoricalClassification-234"><a href="#CategoricalClassification-234"><span class="linenos">234</span></a><span class="sd">        :param cardinality: single value cardinality</span>
+</span><span id="CategoricalClassification-235"><a href="#CategoricalClassification-235"><span class="linenos">235</span></a><span class="sd">        :param size: length of feature vector</span>
+</span><span id="CategoricalClassification-236"><a href="#CategoricalClassification-236"><span class="linenos">236</span></a><span class="sd">        :param ensure_rep: ensures all values are represented at least once in the feature vector</span>
+</span><span id="CategoricalClassification-237"><a href="#CategoricalClassification-237"><span class="linenos">237</span></a><span class="sd">        :param random_values: randomly picked values for vec if true, otherwise values range from [low, cardinality] with by 1</span>
+</span><span id="CategoricalClassification-238"><a href="#CategoricalClassification-238"><span class="linenos">238</span></a><span class="sd">        :param low: lower bound of random feature vector values</span>
+</span><span id="CategoricalClassification-239"><a href="#CategoricalClassification-239"><span class="linenos">239</span></a><span class="sd">        :param high: upper bound of random feature vector values</span>
+</span><span id="CategoricalClassification-240"><a href="#CategoricalClassification-240"><span class="linenos">240</span></a><span class="sd">        :param p: list of probabilities of each value</span>
+</span><span id="CategoricalClassification-241"><a href="#CategoricalClassification-241"><span class="linenos">241</span></a><span class="sd">        :return: feature vector x</span>
+</span><span id="CategoricalClassification-242"><a href="#CategoricalClassification-242"><span class="linenos">242</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-243"><a href="#CategoricalClassification-243"><span class="linenos">243</span></a>
+</span><span id="CategoricalClassification-244"><a href="#CategoricalClassification-244"><span class="linenos">244</span></a>        <span class="k">if</span> <span class="n">vec</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification-245"><a href="#CategoricalClassification-245"><span class="linenos">245</span></a>            <span class="k">if</span> <span class="n">random_values</span><span class="p">:</span>
+</span><span id="CategoricalClassification-246"><a href="#CategoricalClassification-246"><span class="linenos">246</span></a>                <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="n">low</span><span class="p">,</span> <span class="n">high</span> <span class="o">+</span> <span class="mi">1</span><span class="p">),</span> <span class="n">cardinality</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="CategoricalClassification-247"><a href="#CategoricalClassification-247"><span class="linenos">247</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-248"><a href="#CategoricalClassification-248"><span class="linenos">248</span></a>                <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">low</span><span class="p">,</span> <span class="n">low</span> <span class="o">+</span> <span class="n">cardinality</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification-249"><a href="#CategoricalClassification-249"><span class="linenos">249</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-250"><a href="#CategoricalClassification-250"><span class="linenos">250</span></a>            <span class="n">vec</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">vec</span><span class="p">)</span>
+</span><span id="CategoricalClassification-251"><a href="#CategoricalClassification-251"><span class="linenos">251</span></a>
+</span><span id="CategoricalClassification-252"><a href="#CategoricalClassification-252"><span class="linenos">252</span></a>        <span class="k">if</span> <span class="n">p</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification-253"><a href="#CategoricalClassification-253"><span class="linenos">253</span></a>            <span class="n">v_shift</span> <span class="o">=</span> <span class="n">vec</span> <span class="o">-</span> <span class="n">vec</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">))]</span>
+</span><span id="CategoricalClassification-254"><a href="#CategoricalClassification-254"><span class="linenos">254</span></a>            <span class="n">p</span> <span class="o">=</span> <span class="n">norm</span><span class="o">.</span><span class="n">pdf</span><span class="p">(</span><span class="n">v_shift</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="mi">3</span><span class="p">)</span>
+</span><span id="CategoricalClassification-255"><a href="#CategoricalClassification-255"><span class="linenos">255</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-256"><a href="#CategoricalClassification-256"><span class="linenos">256</span></a>            <span class="n">p</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">p</span><span class="p">)</span>
 </span><span id="CategoricalClassification-257"><a href="#CategoricalClassification-257"><span class="linenos">257</span></a>
-</span><span id="CategoricalClassification-258"><a href="#CategoricalClassification-258"><span class="linenos">258</span></a>        <span class="k">if</span> <span class="n">ensure_rep</span> <span class="ow">and</span> <span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">)</span> <span class="o">&lt;</span> <span class="n">size</span><span class="p">:</span>
-</span><span id="CategoricalClassification-259"><a href="#CategoricalClassification-259"><span class="linenos">259</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">vec</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="p">(</span><span class="n">size</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">)),</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">)</span>
-</span><span id="CategoricalClassification-260"><a href="#CategoricalClassification-260"><span class="linenos">260</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">sampled_values</span><span class="p">,</span> <span class="n">vec</span><span class="p">)</span>
-</span><span id="CategoricalClassification-261"><a href="#CategoricalClassification-261"><span class="linenos">261</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-262"><a href="#CategoricalClassification-262"><span class="linenos">262</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">vec</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="n">size</span><span class="p">,</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">)</span>
-</span><span id="CategoricalClassification-263"><a href="#CategoricalClassification-263"><span class="linenos">263</span></a>
-</span><span id="CategoricalClassification-264"><a href="#CategoricalClassification-264"><span class="linenos">264</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">sampled_values</span><span class="p">)</span>
-</span><span id="CategoricalClassification-265"><a href="#CategoricalClassification-265"><span class="linenos">265</span></a>        <span class="k">return</span> <span class="n">sampled_values</span>
-</span><span id="CategoricalClassification-266"><a href="#CategoricalClassification-266"><span class="linenos">266</span></a>
-</span><span id="CategoricalClassification-267"><a href="#CategoricalClassification-267"><span class="linenos">267</span></a>    <span class="k">def</span> <span class="nf">generate_combinations</span><span class="p">(</span>
-</span><span id="CategoricalClassification-268"><a href="#CategoricalClassification-268"><span class="linenos">268</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification-269"><a href="#CategoricalClassification-269"><span class="linenos">269</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification-270"><a href="#CategoricalClassification-270"><span class="linenos">270</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification-271"><a href="#CategoricalClassification-271"><span class="linenos">271</span></a>        <span class="n">combination_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="CategoricalClassification-272"><a href="#CategoricalClassification-272"><span class="linenos">272</span></a>        <span class="n">combination_type</span><span class="p">:</span> <span class="n">Literal</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
-</span><span id="CategoricalClassification-273"><a href="#CategoricalClassification-273"><span class="linenos">273</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="CategoricalClassification-274"><a href="#CategoricalClassification-274"><span class="linenos">274</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-275"><a href="#CategoricalClassification-275"><span class="linenos">275</span></a><span class="sd">        Generates linear, nonlinear, or custom combinations within feature vectors in given dataset X</span>
-</span><span id="CategoricalClassification-276"><a href="#CategoricalClassification-276"><span class="linenos">276</span></a><span class="sd">        :param X: dataset</span>
-</span><span id="CategoricalClassification-277"><a href="#CategoricalClassification-277"><span class="linenos">277</span></a><span class="sd">        :param feature_indices: indexes of features to be in combination</span>
-</span><span id="CategoricalClassification-278"><a href="#CategoricalClassification-278"><span class="linenos">278</span></a><span class="sd">        :param combination_function: optional custom function for combining feature vectors</span>
-</span><span id="CategoricalClassification-279"><a href="#CategoricalClassification-279"><span class="linenos">279</span></a><span class="sd">        :param combination_type: string flag, either liner or nonlinear, defining combination type</span>
-</span><span id="CategoricalClassification-280"><a href="#CategoricalClassification-280"><span class="linenos">280</span></a><span class="sd">        :return: X with added resultant feature</span>
-</span><span id="CategoricalClassification-281"><a href="#CategoricalClassification-281"><span class="linenos">281</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-282"><a href="#CategoricalClassification-282"><span class="linenos">282</span></a>
-</span><span id="CategoricalClassification-283"><a href="#CategoricalClassification-283"><span class="linenos">283</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification-258"><a href="#CategoricalClassification-258"><span class="linenos">258</span></a>        <span class="n">p</span> <span class="o">=</span> <span class="n">p</span> <span class="o">/</span> <span class="n">p</span><span class="o">.</span><span class="n">sum</span><span class="p">()</span>
+</span><span id="CategoricalClassification-259"><a href="#CategoricalClassification-259"><span class="linenos">259</span></a>
+</span><span id="CategoricalClassification-260"><a href="#CategoricalClassification-260"><span class="linenos">260</span></a>        <span class="k">if</span> <span class="n">ensure_rep</span> <span class="ow">and</span> <span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">)</span> <span class="o">&lt;</span> <span class="n">size</span><span class="p">:</span>
+</span><span id="CategoricalClassification-261"><a href="#CategoricalClassification-261"><span class="linenos">261</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">vec</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="p">(</span><span class="n">size</span> <span class="o">-</span> <span class="nb">len</span><span class="p">(</span><span class="n">vec</span><span class="p">)),</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">)</span>
+</span><span id="CategoricalClassification-262"><a href="#CategoricalClassification-262"><span class="linenos">262</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">sampled_values</span><span class="p">,</span> <span class="n">vec</span><span class="p">)</span>
+</span><span id="CategoricalClassification-263"><a href="#CategoricalClassification-263"><span class="linenos">263</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-264"><a href="#CategoricalClassification-264"><span class="linenos">264</span></a>            <span class="n">sampled_values</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">vec</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="n">size</span><span class="p">,</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">)</span>
+</span><span id="CategoricalClassification-265"><a href="#CategoricalClassification-265"><span class="linenos">265</span></a>
+</span><span id="CategoricalClassification-266"><a href="#CategoricalClassification-266"><span class="linenos">266</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">sampled_values</span><span class="p">)</span>
+</span><span id="CategoricalClassification-267"><a href="#CategoricalClassification-267"><span class="linenos">267</span></a>        <span class="k">return</span> <span class="n">sampled_values</span>
+</span><span id="CategoricalClassification-268"><a href="#CategoricalClassification-268"><span class="linenos">268</span></a>
+</span><span id="CategoricalClassification-269"><a href="#CategoricalClassification-269"><span class="linenos">269</span></a>    <span class="k">def</span> <span class="nf">generate_combinations</span><span class="p">(</span>
+</span><span id="CategoricalClassification-270"><a href="#CategoricalClassification-270"><span class="linenos">270</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-271"><a href="#CategoricalClassification-271"><span class="linenos">271</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-272"><a href="#CategoricalClassification-272"><span class="linenos">272</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-273"><a href="#CategoricalClassification-273"><span class="linenos">273</span></a>        <span class="n">combination_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification-274"><a href="#CategoricalClassification-274"><span class="linenos">274</span></a>        <span class="n">combination_type</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;linear&#39;</span><span class="p">,</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
+</span><span id="CategoricalClassification-275"><a href="#CategoricalClassification-275"><span class="linenos">275</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-276"><a href="#CategoricalClassification-276"><span class="linenos">276</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-277"><a href="#CategoricalClassification-277"><span class="linenos">277</span></a><span class="sd">        Generates linear, nonlinear, or custom combinations within feature vectors in given dataset X</span>
+</span><span id="CategoricalClassification-278"><a href="#CategoricalClassification-278"><span class="linenos">278</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification-279"><a href="#CategoricalClassification-279"><span class="linenos">279</span></a><span class="sd">        :param feature_indices: indexes of features to be in combination</span>
+</span><span id="CategoricalClassification-280"><a href="#CategoricalClassification-280"><span class="linenos">280</span></a><span class="sd">        :param combination_function: optional custom function for combining feature vectors</span>
+</span><span id="CategoricalClassification-281"><a href="#CategoricalClassification-281"><span class="linenos">281</span></a><span class="sd">        :param combination_type: string flag, either liner or nonlinear, defining combination type</span>
+</span><span id="CategoricalClassification-282"><a href="#CategoricalClassification-282"><span class="linenos">282</span></a><span class="sd">        :return: X with added resultant feature</span>
+</span><span id="CategoricalClassification-283"><a href="#CategoricalClassification-283"><span class="linenos">283</span></a><span class="sd">        &quot;&quot;&quot;</span>
 </span><span id="CategoricalClassification-284"><a href="#CategoricalClassification-284"><span class="linenos">284</span></a>
-</span><span id="CategoricalClassification-285"><a href="#CategoricalClassification-285"><span class="linenos">285</span></a>        <span class="k">if</span> <span class="n">combination_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="CategoricalClassification-286"><a href="#CategoricalClassification-286"><span class="linenos">286</span></a>            <span class="k">if</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
-</span><span id="CategoricalClassification-287"><a href="#CategoricalClassification-287"><span class="linenos">287</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="CategoricalClassification-288"><a href="#CategoricalClassification-288"><span class="linenos">288</span></a>            <span class="k">elif</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
-</span><span id="CategoricalClassification-289"><a href="#CategoricalClassification-289"><span class="linenos">289</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">))</span>
-</span><span id="CategoricalClassification-290"><a href="#CategoricalClassification-290"><span class="linenos">290</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-291"><a href="#CategoricalClassification-291"><span class="linenos">291</span></a>            <span class="n">combination_type</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">combination_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
-</span><span id="CategoricalClassification-292"><a href="#CategoricalClassification-292"><span class="linenos">292</span></a>
-</span><span id="CategoricalClassification-293"><a href="#CategoricalClassification-293"><span class="linenos">293</span></a>        <span class="n">combination_result</span> <span class="o">=</span> <span class="n">combination_function</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
+</span><span id="CategoricalClassification-285"><a href="#CategoricalClassification-285"><span class="linenos">285</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification-286"><a href="#CategoricalClassification-286"><span class="linenos">286</span></a>
+</span><span id="CategoricalClassification-287"><a href="#CategoricalClassification-287"><span class="linenos">287</span></a>        <span class="k">if</span> <span class="n">combination_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification-288"><a href="#CategoricalClassification-288"><span class="linenos">288</span></a>            <span class="k">if</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification-289"><a href="#CategoricalClassification-289"><span class="linenos">289</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification-290"><a href="#CategoricalClassification-290"><span class="linenos">290</span></a>            <span class="k">elif</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification-291"><a href="#CategoricalClassification-291"><span class="linenos">291</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="CategoricalClassification-292"><a href="#CategoricalClassification-292"><span class="linenos">292</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-293"><a href="#CategoricalClassification-293"><span class="linenos">293</span></a>            <span class="n">combination_type</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">combination_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
 </span><span id="CategoricalClassification-294"><a href="#CategoricalClassification-294"><span class="linenos">294</span></a>
-</span><span id="CategoricalClassification-295"><a href="#CategoricalClassification-295"><span class="linenos">295</span></a>        <span class="n">combination_ix</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="CategoricalClassification-295"><a href="#CategoricalClassification-295"><span class="linenos">295</span></a>        <span class="n">combination_result</span> <span class="o">=</span> <span class="n">combination_function</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
 </span><span id="CategoricalClassification-296"><a href="#CategoricalClassification-296"><span class="linenos">296</span></a>
-</span><span id="CategoricalClassification-297"><a href="#CategoricalClassification-297"><span class="linenos">297</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="CategoricalClassification-298"><a href="#CategoricalClassification-298"><span class="linenos">298</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
-</span><span id="CategoricalClassification-299"><a href="#CategoricalClassification-299"><span class="linenos">299</span></a>            <span class="s1">&#39;combination_type&#39;</span><span class="p">:</span> <span class="n">combination_type</span><span class="p">,</span>
-</span><span id="CategoricalClassification-300"><a href="#CategoricalClassification-300"><span class="linenos">300</span></a>            <span class="s1">&#39;combination_ix&#39;</span><span class="p">:</span> <span class="n">combination_ix</span><span class="p">,</span>
-</span><span id="CategoricalClassification-301"><a href="#CategoricalClassification-301"><span class="linenos">301</span></a>        <span class="p">})</span>
-</span><span id="CategoricalClassification-302"><a href="#CategoricalClassification-302"><span class="linenos">302</span></a>
-</span><span id="CategoricalClassification-303"><a href="#CategoricalClassification-303"><span class="linenos">303</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">combination_result</span><span class="p">))</span>
+</span><span id="CategoricalClassification-297"><a href="#CategoricalClassification-297"><span class="linenos">297</span></a>        <span class="n">combination_ix</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="CategoricalClassification-298"><a href="#CategoricalClassification-298"><span class="linenos">298</span></a>
+</span><span id="CategoricalClassification-299"><a href="#CategoricalClassification-299"><span class="linenos">299</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="CategoricalClassification-300"><a href="#CategoricalClassification-300"><span class="linenos">300</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="CategoricalClassification-301"><a href="#CategoricalClassification-301"><span class="linenos">301</span></a>            <span class="s1">&#39;combination_type&#39;</span><span class="p">:</span> <span class="n">combination_type</span><span class="p">,</span>
+</span><span id="CategoricalClassification-302"><a href="#CategoricalClassification-302"><span class="linenos">302</span></a>            <span class="s1">&#39;combination_ix&#39;</span><span class="p">:</span> <span class="n">combination_ix</span><span class="p">,</span>
+</span><span id="CategoricalClassification-303"><a href="#CategoricalClassification-303"><span class="linenos">303</span></a>        <span class="p">})</span>
 </span><span id="CategoricalClassification-304"><a href="#CategoricalClassification-304"><span class="linenos">304</span></a>
-</span><span id="CategoricalClassification-305"><a href="#CategoricalClassification-305"><span class="linenos">305</span></a>    <span class="k">def</span> <span class="nf">_xor</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="CategoricalClassification-306"><a href="#CategoricalClassification-306"><span class="linenos">306</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-307"><a href="#CategoricalClassification-307"><span class="linenos">307</span></a><span class="sd">        Performs bitwise XOR operation on two integer arrays</span>
-</span><span id="CategoricalClassification-308"><a href="#CategoricalClassification-308"><span class="linenos">308</span></a><span class="sd">        :param arr: features to perform XOR operation on</span>
-</span><span id="CategoricalClassification-309"><a href="#CategoricalClassification-309"><span class="linenos">309</span></a><span class="sd">        :return: bitwise XOR result</span>
-</span><span id="CategoricalClassification-310"><a href="#CategoricalClassification-310"><span class="linenos">310</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-311"><a href="#CategoricalClassification-311"><span class="linenos">311</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
-</span><span id="CategoricalClassification-312"><a href="#CategoricalClassification-312"><span class="linenos">312</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
-</span><span id="CategoricalClassification-313"><a href="#CategoricalClassification-313"><span class="linenos">313</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
-</span><span id="CategoricalClassification-314"><a href="#CategoricalClassification-314"><span class="linenos">314</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="CategoricalClassification-315"><a href="#CategoricalClassification-315"><span class="linenos">315</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
-</span><span id="CategoricalClassification-316"><a href="#CategoricalClassification-316"><span class="linenos">316</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
-</span><span id="CategoricalClassification-317"><a href="#CategoricalClassification-317"><span class="linenos">317</span></a>
-</span><span id="CategoricalClassification-318"><a href="#CategoricalClassification-318"><span class="linenos">318</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-305"><a href="#CategoricalClassification-305"><span class="linenos">305</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">combination_result</span><span class="p">))</span>
+</span><span id="CategoricalClassification-306"><a href="#CategoricalClassification-306"><span class="linenos">306</span></a>
+</span><span id="CategoricalClassification-307"><a href="#CategoricalClassification-307"><span class="linenos">307</span></a>    <span class="k">def</span> <span class="nf">_xor</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-308"><a href="#CategoricalClassification-308"><span class="linenos">308</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-309"><a href="#CategoricalClassification-309"><span class="linenos">309</span></a><span class="sd">        Performs bitwise XOR operation on two integer arrays</span>
+</span><span id="CategoricalClassification-310"><a href="#CategoricalClassification-310"><span class="linenos">310</span></a><span class="sd">        :param arr: features to perform XOR operation on</span>
+</span><span id="CategoricalClassification-311"><a href="#CategoricalClassification-311"><span class="linenos">311</span></a><span class="sd">        :return: bitwise XOR result</span>
+</span><span id="CategoricalClassification-312"><a href="#CategoricalClassification-312"><span class="linenos">312</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-313"><a href="#CategoricalClassification-313"><span class="linenos">313</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-314"><a href="#CategoricalClassification-314"><span class="linenos">314</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="CategoricalClassification-315"><a href="#CategoricalClassification-315"><span class="linenos">315</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="CategoricalClassification-316"><a href="#CategoricalClassification-316"><span class="linenos">316</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="CategoricalClassification-317"><a href="#CategoricalClassification-317"><span class="linenos">317</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-318"><a href="#CategoricalClassification-318"><span class="linenos">318</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
 </span><span id="CategoricalClassification-319"><a href="#CategoricalClassification-319"><span class="linenos">319</span></a>
-</span><span id="CategoricalClassification-320"><a href="#CategoricalClassification-320"><span class="linenos">320</span></a>    <span class="k">def</span> <span class="nf">_and</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="CategoricalClassification-321"><a href="#CategoricalClassification-321"><span class="linenos">321</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-322"><a href="#CategoricalClassification-322"><span class="linenos">322</span></a><span class="sd">        Performs bitwise AND operation on two integer arrays</span>
-</span><span id="CategoricalClassification-323"><a href="#CategoricalClassification-323"><span class="linenos">323</span></a><span class="sd">        :param arr: features to perform AND operation on</span>
-</span><span id="CategoricalClassification-324"><a href="#CategoricalClassification-324"><span class="linenos">324</span></a><span class="sd">        :return: bitwise AND result</span>
-</span><span id="CategoricalClassification-325"><a href="#CategoricalClassification-325"><span class="linenos">325</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-326"><a href="#CategoricalClassification-326"><span class="linenos">326</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
-</span><span id="CategoricalClassification-327"><a href="#CategoricalClassification-327"><span class="linenos">327</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
-</span><span id="CategoricalClassification-328"><a href="#CategoricalClassification-328"><span class="linenos">328</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
-</span><span id="CategoricalClassification-329"><a href="#CategoricalClassification-329"><span class="linenos">329</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="CategoricalClassification-330"><a href="#CategoricalClassification-330"><span class="linenos">330</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
-</span><span id="CategoricalClassification-331"><a href="#CategoricalClassification-331"><span class="linenos">331</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_and</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
-</span><span id="CategoricalClassification-332"><a href="#CategoricalClassification-332"><span class="linenos">332</span></a>
-</span><span id="CategoricalClassification-333"><a href="#CategoricalClassification-333"><span class="linenos">333</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-320"><a href="#CategoricalClassification-320"><span class="linenos">320</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-321"><a href="#CategoricalClassification-321"><span class="linenos">321</span></a>
+</span><span id="CategoricalClassification-322"><a href="#CategoricalClassification-322"><span class="linenos">322</span></a>    <span class="k">def</span> <span class="nf">_and</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-323"><a href="#CategoricalClassification-323"><span class="linenos">323</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-324"><a href="#CategoricalClassification-324"><span class="linenos">324</span></a><span class="sd">        Performs bitwise AND operation on two integer arrays</span>
+</span><span id="CategoricalClassification-325"><a href="#CategoricalClassification-325"><span class="linenos">325</span></a><span class="sd">        :param arr: features to perform AND operation on</span>
+</span><span id="CategoricalClassification-326"><a href="#CategoricalClassification-326"><span class="linenos">326</span></a><span class="sd">        :return: bitwise AND result</span>
+</span><span id="CategoricalClassification-327"><a href="#CategoricalClassification-327"><span class="linenos">327</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-328"><a href="#CategoricalClassification-328"><span class="linenos">328</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-329"><a href="#CategoricalClassification-329"><span class="linenos">329</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="CategoricalClassification-330"><a href="#CategoricalClassification-330"><span class="linenos">330</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="CategoricalClassification-331"><a href="#CategoricalClassification-331"><span class="linenos">331</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="CategoricalClassification-332"><a href="#CategoricalClassification-332"><span class="linenos">332</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-333"><a href="#CategoricalClassification-333"><span class="linenos">333</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_and</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
 </span><span id="CategoricalClassification-334"><a href="#CategoricalClassification-334"><span class="linenos">334</span></a>
-</span><span id="CategoricalClassification-335"><a href="#CategoricalClassification-335"><span class="linenos">335</span></a>    <span class="k">def</span> <span class="nf">_or</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="CategoricalClassification-336"><a href="#CategoricalClassification-336"><span class="linenos">336</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-337"><a href="#CategoricalClassification-337"><span class="linenos">337</span></a><span class="sd">        Performs bitwise OR operation on two integer arrays</span>
-</span><span id="CategoricalClassification-338"><a href="#CategoricalClassification-338"><span class="linenos">338</span></a><span class="sd">        :param arr: features to perform OR operation on</span>
-</span><span id="CategoricalClassification-339"><a href="#CategoricalClassification-339"><span class="linenos">339</span></a><span class="sd">        :return: bitwise OR result</span>
-</span><span id="CategoricalClassification-340"><a href="#CategoricalClassification-340"><span class="linenos">340</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-341"><a href="#CategoricalClassification-341"><span class="linenos">341</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
-</span><span id="CategoricalClassification-342"><a href="#CategoricalClassification-342"><span class="linenos">342</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
-</span><span id="CategoricalClassification-343"><a href="#CategoricalClassification-343"><span class="linenos">343</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
-</span><span id="CategoricalClassification-344"><a href="#CategoricalClassification-344"><span class="linenos">344</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="CategoricalClassification-345"><a href="#CategoricalClassification-345"><span class="linenos">345</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
-</span><span id="CategoricalClassification-346"><a href="#CategoricalClassification-346"><span class="linenos">346</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_or</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
-</span><span id="CategoricalClassification-347"><a href="#CategoricalClassification-347"><span class="linenos">347</span></a>
-</span><span id="CategoricalClassification-348"><a href="#CategoricalClassification-348"><span class="linenos">348</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-335"><a href="#CategoricalClassification-335"><span class="linenos">335</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-336"><a href="#CategoricalClassification-336"><span class="linenos">336</span></a>
+</span><span id="CategoricalClassification-337"><a href="#CategoricalClassification-337"><span class="linenos">337</span></a>    <span class="k">def</span> <span class="nf">_or</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">arr</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-338"><a href="#CategoricalClassification-338"><span class="linenos">338</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-339"><a href="#CategoricalClassification-339"><span class="linenos">339</span></a><span class="sd">        Performs bitwise OR operation on two integer arrays</span>
+</span><span id="CategoricalClassification-340"><a href="#CategoricalClassification-340"><span class="linenos">340</span></a><span class="sd">        :param arr: features to perform OR operation on</span>
+</span><span id="CategoricalClassification-341"><a href="#CategoricalClassification-341"><span class="linenos">341</span></a><span class="sd">        :return: bitwise OR result</span>
+</span><span id="CategoricalClassification-342"><a href="#CategoricalClassification-342"><span class="linenos">342</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-343"><a href="#CategoricalClassification-343"><span class="linenos">343</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arr</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-344"><a href="#CategoricalClassification-344"><span class="linenos">344</span></a>        <span class="n">arrT</span> <span class="o">=</span> <span class="n">arrT</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="CategoricalClassification-345"><a href="#CategoricalClassification-345"><span class="linenos">345</span></a>        <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_xor</span><span class="p">(</span><span class="n">arrT</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">arrT</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="CategoricalClassification-346"><a href="#CategoricalClassification-346"><span class="linenos">346</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="CategoricalClassification-347"><a href="#CategoricalClassification-347"><span class="linenos">347</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">arrT</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-348"><a href="#CategoricalClassification-348"><span class="linenos">348</span></a>                <span class="n">out</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">bitwise_or</span><span class="p">(</span><span class="n">out</span><span class="p">,</span> <span class="n">arrT</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
 </span><span id="CategoricalClassification-349"><a href="#CategoricalClassification-349"><span class="linenos">349</span></a>
-</span><span id="CategoricalClassification-350"><a href="#CategoricalClassification-350"><span class="linenos">350</span></a>    <span class="k">def</span> <span class="nf">generate_correlated</span><span class="p">(</span>
-</span><span id="CategoricalClassification-351"><a href="#CategoricalClassification-351"><span class="linenos">351</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification-352"><a href="#CategoricalClassification-352"><span class="linenos">352</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification-353"><a href="#CategoricalClassification-353"><span class="linenos">353</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification-354"><a href="#CategoricalClassification-354"><span class="linenos">354</span></a>        <span class="n">r</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.8</span><span class="p">,</span>
-</span><span id="CategoricalClassification-355"><a href="#CategoricalClassification-355"><span class="linenos">355</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="CategoricalClassification-356"><a href="#CategoricalClassification-356"><span class="linenos">356</span></a>
-</span><span id="CategoricalClassification-357"><a href="#CategoricalClassification-357"><span class="linenos">357</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-358"><a href="#CategoricalClassification-358"><span class="linenos">358</span></a><span class="sd">        Generates correlated features using the given feature indices. Correlation is based on cosine of angle between vectors with mean 0.</span>
-</span><span id="CategoricalClassification-359"><a href="#CategoricalClassification-359"><span class="linenos">359</span></a><span class="sd">        :param X: dataset</span>
-</span><span id="CategoricalClassification-360"><a href="#CategoricalClassification-360"><span class="linenos">360</span></a><span class="sd">        :param feature_indices: indices of features to generate correlated feature to</span>
-</span><span id="CategoricalClassification-361"><a href="#CategoricalClassification-361"><span class="linenos">361</span></a><span class="sd">        :param r: (Pearson) correlation factor</span>
-</span><span id="CategoricalClassification-362"><a href="#CategoricalClassification-362"><span class="linenos">362</span></a><span class="sd">        :return: X with generated correlated  features</span>
-</span><span id="CategoricalClassification-363"><a href="#CategoricalClassification-363"><span class="linenos">363</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-364"><a href="#CategoricalClassification-364"><span class="linenos">364</span></a>
-</span><span id="CategoricalClassification-365"><a href="#CategoricalClassification-365"><span class="linenos">365</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="CategoricalClassification-366"><a href="#CategoricalClassification-366"><span class="linenos">366</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
-</span><span id="CategoricalClassification-367"><a href="#CategoricalClassification-367"><span class="linenos">367</span></a>
-</span><span id="CategoricalClassification-368"><a href="#CategoricalClassification-368"><span class="linenos">368</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="CategoricalClassification-369"><a href="#CategoricalClassification-369"><span class="linenos">369</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)),</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="CategoricalClassification-370"><a href="#CategoricalClassification-370"><span class="linenos">370</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-371"><a href="#CategoricalClassification-371"><span class="linenos">371</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
-</span><span id="CategoricalClassification-372"><a href="#CategoricalClassification-372"><span class="linenos">372</span></a>
-</span><span id="CategoricalClassification-373"><a href="#CategoricalClassification-373"><span class="linenos">373</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
-</span><span id="CategoricalClassification-374"><a href="#CategoricalClassification-374"><span class="linenos">374</span></a>        <span class="n">transposed</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
-</span><span id="CategoricalClassification-375"><a href="#CategoricalClassification-375"><span class="linenos">375</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="CategoricalClassification-376"><a href="#CategoricalClassification-376"><span class="linenos">376</span></a>
-</span><span id="CategoricalClassification-377"><a href="#CategoricalClassification-377"><span class="linenos">377</span></a>        <span class="k">for</span> <span class="n">t</span> <span class="ow">in</span> <span class="n">transposed</span><span class="p">:</span>
-</span><span id="CategoricalClassification-378"><a href="#CategoricalClassification-378"><span class="linenos">378</span></a>            <span class="n">theta</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arccos</span><span class="p">(</span><span class="n">r</span><span class="p">)</span>
-</span><span id="CategoricalClassification-379"><a href="#CategoricalClassification-379"><span class="linenos">379</span></a>            <span class="n">t_standard</span> <span class="o">=</span> <span class="p">(</span><span class="n">t</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">t</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">t</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
-</span><span id="CategoricalClassification-380"><a href="#CategoricalClassification-380"><span class="linenos">380</span></a>
-</span><span id="CategoricalClassification-381"><a href="#CategoricalClassification-381"><span class="linenos">381</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">normal</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">t_standard</span><span class="p">))</span>
-</span><span id="CategoricalClassification-382"><a href="#CategoricalClassification-382"><span class="linenos">382</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="p">(</span><span class="n">rand</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">rand</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">rand</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
-</span><span id="CategoricalClassification-383"><a href="#CategoricalClassification-383"><span class="linenos">383</span></a>
-</span><span id="CategoricalClassification-384"><a href="#CategoricalClassification-384"><span class="linenos">384</span></a>            <span class="n">M</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">t_standard</span><span class="p">,</span> <span class="n">rand</span><span class="p">))</span>
-</span><span id="CategoricalClassification-385"><a href="#CategoricalClassification-385"><span class="linenos">385</span></a>            <span class="n">M_centred</span> <span class="o">=</span> <span class="p">(</span><span class="n">M</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">M</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))</span>
-</span><span id="CategoricalClassification-386"><a href="#CategoricalClassification-386"><span class="linenos">386</span></a>
-</span><span id="CategoricalClassification-387"><a href="#CategoricalClassification-387"><span class="linenos">387</span></a>            <span class="n">Id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">eye</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">t</span><span class="p">))</span>
-</span><span id="CategoricalClassification-388"><a href="#CategoricalClassification-388"><span class="linenos">388</span></a>            <span class="n">Q</span> <span class="o">=</span> <span class="n">qr</span><span class="p">(</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="p">[</span><span class="mi">0</span><span class="p">]],</span> <span class="n">mode</span><span class="o">=</span><span class="s1">&#39;economic&#39;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="CategoricalClassification-389"><a href="#CategoricalClassification-389"><span class="linenos">389</span></a>            <span class="n">P</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Q</span><span class="p">,</span> <span class="n">Q</span><span class="o">.</span><span class="n">T</span><span class="p">)</span>
-</span><span id="CategoricalClassification-390"><a href="#CategoricalClassification-390"><span class="linenos">390</span></a>            <span class="n">orthogonal_projection</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Id</span> <span class="o">-</span> <span class="n">P</span><span class="p">,</span> <span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">])</span>
-</span><span id="CategoricalClassification-391"><a href="#CategoricalClassification-391"><span class="linenos">391</span></a>            <span class="n">M_orthogonal</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">],</span> <span class="n">orthogonal_projection</span><span class="p">))</span>
-</span><span id="CategoricalClassification-392"><a href="#CategoricalClassification-392"><span class="linenos">392</span></a>
-</span><span id="CategoricalClassification-393"><a href="#CategoricalClassification-393"><span class="linenos">393</span></a>            <span class="n">Y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">M_orthogonal</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">M_orthogonal</span> <span class="o">**</span> <span class="mi">2</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))))</span>
-</span><span id="CategoricalClassification-394"><a href="#CategoricalClassification-394"><span class="linenos">394</span></a>            <span class="n">corr</span> <span class="o">=</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">tan</span><span class="p">(</span><span class="n">theta</span><span class="p">))</span> <span class="o">*</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">]</span>
-</span><span id="CategoricalClassification-395"><a href="#CategoricalClassification-395"><span class="linenos">395</span></a>
-</span><span id="CategoricalClassification-396"><a href="#CategoricalClassification-396"><span class="linenos">396</span></a>            <span class="n">correlated_features</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">corr</span><span class="p">)</span>
+</span><span id="CategoricalClassification-350"><a href="#CategoricalClassification-350"><span class="linenos">350</span></a>        <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-351"><a href="#CategoricalClassification-351"><span class="linenos">351</span></a>
+</span><span id="CategoricalClassification-352"><a href="#CategoricalClassification-352"><span class="linenos">352</span></a>    <span class="k">def</span> <span class="nf">generate_correlated</span><span class="p">(</span>
+</span><span id="CategoricalClassification-353"><a href="#CategoricalClassification-353"><span class="linenos">353</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-354"><a href="#CategoricalClassification-354"><span class="linenos">354</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-355"><a href="#CategoricalClassification-355"><span class="linenos">355</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-356"><a href="#CategoricalClassification-356"><span class="linenos">356</span></a>        <span class="n">r</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.8</span><span class="p">,</span>
+</span><span id="CategoricalClassification-357"><a href="#CategoricalClassification-357"><span class="linenos">357</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-358"><a href="#CategoricalClassification-358"><span class="linenos">358</span></a>
+</span><span id="CategoricalClassification-359"><a href="#CategoricalClassification-359"><span class="linenos">359</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-360"><a href="#CategoricalClassification-360"><span class="linenos">360</span></a><span class="sd">        Generates correlated features using the given feature indices. Correlation is based on cosine of angle between vectors with mean 0.</span>
+</span><span id="CategoricalClassification-361"><a href="#CategoricalClassification-361"><span class="linenos">361</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification-362"><a href="#CategoricalClassification-362"><span class="linenos">362</span></a><span class="sd">        :param feature_indices: indices of features to generate correlated feature to</span>
+</span><span id="CategoricalClassification-363"><a href="#CategoricalClassification-363"><span class="linenos">363</span></a><span class="sd">        :param r: (Pearson) correlation factor</span>
+</span><span id="CategoricalClassification-364"><a href="#CategoricalClassification-364"><span class="linenos">364</span></a><span class="sd">        :return: X with generated correlated  features</span>
+</span><span id="CategoricalClassification-365"><a href="#CategoricalClassification-365"><span class="linenos">365</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-366"><a href="#CategoricalClassification-366"><span class="linenos">366</span></a>
+</span><span id="CategoricalClassification-367"><a href="#CategoricalClassification-367"><span class="linenos">367</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-368"><a href="#CategoricalClassification-368"><span class="linenos">368</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
+</span><span id="CategoricalClassification-369"><a href="#CategoricalClassification-369"><span class="linenos">369</span></a>
+</span><span id="CategoricalClassification-370"><a href="#CategoricalClassification-370"><span class="linenos">370</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="CategoricalClassification-371"><a href="#CategoricalClassification-371"><span class="linenos">371</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)),</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification-372"><a href="#CategoricalClassification-372"><span class="linenos">372</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-373"><a href="#CategoricalClassification-373"><span class="linenos">373</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="CategoricalClassification-374"><a href="#CategoricalClassification-374"><span class="linenos">374</span></a>
+</span><span id="CategoricalClassification-375"><a href="#CategoricalClassification-375"><span class="linenos">375</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification-376"><a href="#CategoricalClassification-376"><span class="linenos">376</span></a>        <span class="n">transposed</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
+</span><span id="CategoricalClassification-377"><a href="#CategoricalClassification-377"><span class="linenos">377</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification-378"><a href="#CategoricalClassification-378"><span class="linenos">378</span></a>
+</span><span id="CategoricalClassification-379"><a href="#CategoricalClassification-379"><span class="linenos">379</span></a>        <span class="k">for</span> <span class="n">t</span> <span class="ow">in</span> <span class="n">transposed</span><span class="p">:</span>
+</span><span id="CategoricalClassification-380"><a href="#CategoricalClassification-380"><span class="linenos">380</span></a>            <span class="n">theta</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arccos</span><span class="p">(</span><span class="n">r</span><span class="p">)</span>
+</span><span id="CategoricalClassification-381"><a href="#CategoricalClassification-381"><span class="linenos">381</span></a>            <span class="n">t_standard</span> <span class="o">=</span> <span class="p">(</span><span class="n">t</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">t</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">t</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
+</span><span id="CategoricalClassification-382"><a href="#CategoricalClassification-382"><span class="linenos">382</span></a>
+</span><span id="CategoricalClassification-383"><a href="#CategoricalClassification-383"><span class="linenos">383</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">normal</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">t_standard</span><span class="p">))</span>
+</span><span id="CategoricalClassification-384"><a href="#CategoricalClassification-384"><span class="linenos">384</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="p">(</span><span class="n">rand</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">rand</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">rand</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
+</span><span id="CategoricalClassification-385"><a href="#CategoricalClassification-385"><span class="linenos">385</span></a>
+</span><span id="CategoricalClassification-386"><a href="#CategoricalClassification-386"><span class="linenos">386</span></a>            <span class="n">M</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">t_standard</span><span class="p">,</span> <span class="n">rand</span><span class="p">))</span>
+</span><span id="CategoricalClassification-387"><a href="#CategoricalClassification-387"><span class="linenos">387</span></a>            <span class="n">M_centred</span> <span class="o">=</span> <span class="p">(</span><span class="n">M</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">M</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))</span>
+</span><span id="CategoricalClassification-388"><a href="#CategoricalClassification-388"><span class="linenos">388</span></a>
+</span><span id="CategoricalClassification-389"><a href="#CategoricalClassification-389"><span class="linenos">389</span></a>            <span class="n">Id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">eye</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">t</span><span class="p">))</span>
+</span><span id="CategoricalClassification-390"><a href="#CategoricalClassification-390"><span class="linenos">390</span></a>            <span class="n">Q</span> <span class="o">=</span> <span class="n">qr</span><span class="p">(</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="p">[</span><span class="mi">0</span><span class="p">]],</span> <span class="n">mode</span><span class="o">=</span><span class="s1">&#39;economic&#39;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="CategoricalClassification-391"><a href="#CategoricalClassification-391"><span class="linenos">391</span></a>            <span class="n">P</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Q</span><span class="p">,</span> <span class="n">Q</span><span class="o">.</span><span class="n">T</span><span class="p">)</span>
+</span><span id="CategoricalClassification-392"><a href="#CategoricalClassification-392"><span class="linenos">392</span></a>            <span class="n">orthogonal_projection</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Id</span> <span class="o">-</span> <span class="n">P</span><span class="p">,</span> <span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">])</span>
+</span><span id="CategoricalClassification-393"><a href="#CategoricalClassification-393"><span class="linenos">393</span></a>            <span class="n">M_orthogonal</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">],</span> <span class="n">orthogonal_projection</span><span class="p">))</span>
+</span><span id="CategoricalClassification-394"><a href="#CategoricalClassification-394"><span class="linenos">394</span></a>
+</span><span id="CategoricalClassification-395"><a href="#CategoricalClassification-395"><span class="linenos">395</span></a>            <span class="n">Y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">M_orthogonal</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">M_orthogonal</span> <span class="o">**</span> <span class="mi">2</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))))</span>
+</span><span id="CategoricalClassification-396"><a href="#CategoricalClassification-396"><span class="linenos">396</span></a>            <span class="n">corr</span> <span class="o">=</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">tan</span><span class="p">(</span><span class="n">theta</span><span class="p">))</span> <span class="o">*</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">]</span>
 </span><span id="CategoricalClassification-397"><a href="#CategoricalClassification-397"><span class="linenos">397</span></a>
-</span><span id="CategoricalClassification-398"><a href="#CategoricalClassification-398"><span class="linenos">398</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">correlated_features</span><span class="p">)</span>
+</span><span id="CategoricalClassification-398"><a href="#CategoricalClassification-398"><span class="linenos">398</span></a>            <span class="n">correlated_features</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">corr</span><span class="p">)</span>
 </span><span id="CategoricalClassification-399"><a href="#CategoricalClassification-399"><span class="linenos">399</span></a>
-</span><span id="CategoricalClassification-400"><a href="#CategoricalClassification-400"><span class="linenos">400</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="CategoricalClassification-401"><a href="#CategoricalClassification-401"><span class="linenos">401</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
-</span><span id="CategoricalClassification-402"><a href="#CategoricalClassification-402"><span class="linenos">402</span></a>            <span class="s1">&#39;correlated_indices&#39;</span><span class="p">:</span> <span class="n">correlated_ixs</span><span class="p">,</span>
-</span><span id="CategoricalClassification-403"><a href="#CategoricalClassification-403"><span class="linenos">403</span></a>            <span class="s1">&#39;correlation_factor&#39;</span><span class="p">:</span> <span class="n">r</span><span class="p">,</span>
-</span><span id="CategoricalClassification-404"><a href="#CategoricalClassification-404"><span class="linenos">404</span></a>        <span class="p">})</span>
-</span><span id="CategoricalClassification-405"><a href="#CategoricalClassification-405"><span class="linenos">405</span></a>
-</span><span id="CategoricalClassification-406"><a href="#CategoricalClassification-406"><span class="linenos">406</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">correlated_features</span><span class="p">))</span>
+</span><span id="CategoricalClassification-400"><a href="#CategoricalClassification-400"><span class="linenos">400</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">correlated_features</span><span class="p">)</span>
+</span><span id="CategoricalClassification-401"><a href="#CategoricalClassification-401"><span class="linenos">401</span></a>
+</span><span id="CategoricalClassification-402"><a href="#CategoricalClassification-402"><span class="linenos">402</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="CategoricalClassification-403"><a href="#CategoricalClassification-403"><span class="linenos">403</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="CategoricalClassification-404"><a href="#CategoricalClassification-404"><span class="linenos">404</span></a>            <span class="s1">&#39;correlated_indices&#39;</span><span class="p">:</span> <span class="n">correlated_ixs</span><span class="p">,</span>
+</span><span id="CategoricalClassification-405"><a href="#CategoricalClassification-405"><span class="linenos">405</span></a>            <span class="s1">&#39;correlation_factor&#39;</span><span class="p">:</span> <span class="n">r</span><span class="p">,</span>
+</span><span id="CategoricalClassification-406"><a href="#CategoricalClassification-406"><span class="linenos">406</span></a>        <span class="p">})</span>
 </span><span id="CategoricalClassification-407"><a href="#CategoricalClassification-407"><span class="linenos">407</span></a>
-</span><span id="CategoricalClassification-408"><a href="#CategoricalClassification-408"><span class="linenos">408</span></a>    <span class="k">def</span> <span class="nf">generate_duplicates</span><span class="p">(</span>
-</span><span id="CategoricalClassification-409"><a href="#CategoricalClassification-409"><span class="linenos">409</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification-410"><a href="#CategoricalClassification-410"><span class="linenos">410</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification-411"><a href="#CategoricalClassification-411"><span class="linenos">411</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification-412"><a href="#CategoricalClassification-412"><span class="linenos">412</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="CategoricalClassification-413"><a href="#CategoricalClassification-413"><span class="linenos">413</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-414"><a href="#CategoricalClassification-414"><span class="linenos">414</span></a><span class="sd">        Generates duplicate features</span>
-</span><span id="CategoricalClassification-415"><a href="#CategoricalClassification-415"><span class="linenos">415</span></a><span class="sd">        :param X: dataset</span>
-</span><span id="CategoricalClassification-416"><a href="#CategoricalClassification-416"><span class="linenos">416</span></a><span class="sd">        :param feature_indices: indices of features to duplicate</span>
-</span><span id="CategoricalClassification-417"><a href="#CategoricalClassification-417"><span class="linenos">417</span></a><span class="sd">        :return: dataset with duplicated features</span>
-</span><span id="CategoricalClassification-418"><a href="#CategoricalClassification-418"><span class="linenos">418</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-419"><a href="#CategoricalClassification-419"><span class="linenos">419</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="CategoricalClassification-420"><a href="#CategoricalClassification-420"><span class="linenos">420</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
-</span><span id="CategoricalClassification-421"><a href="#CategoricalClassification-421"><span class="linenos">421</span></a>
-</span><span id="CategoricalClassification-422"><a href="#CategoricalClassification-422"><span class="linenos">422</span></a>        <span class="n">duplicated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">),</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification-408"><a href="#CategoricalClassification-408"><span class="linenos">408</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">correlated_features</span><span class="p">))</span>
+</span><span id="CategoricalClassification-409"><a href="#CategoricalClassification-409"><span class="linenos">409</span></a>
+</span><span id="CategoricalClassification-410"><a href="#CategoricalClassification-410"><span class="linenos">410</span></a>    <span class="k">def</span> <span class="nf">generate_duplicates</span><span class="p">(</span>
+</span><span id="CategoricalClassification-411"><a href="#CategoricalClassification-411"><span class="linenos">411</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-412"><a href="#CategoricalClassification-412"><span class="linenos">412</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-413"><a href="#CategoricalClassification-413"><span class="linenos">413</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-414"><a href="#CategoricalClassification-414"><span class="linenos">414</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-415"><a href="#CategoricalClassification-415"><span class="linenos">415</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-416"><a href="#CategoricalClassification-416"><span class="linenos">416</span></a><span class="sd">        Generates duplicate features</span>
+</span><span id="CategoricalClassification-417"><a href="#CategoricalClassification-417"><span class="linenos">417</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification-418"><a href="#CategoricalClassification-418"><span class="linenos">418</span></a><span class="sd">        :param feature_indices: indices of features to duplicate</span>
+</span><span id="CategoricalClassification-419"><a href="#CategoricalClassification-419"><span class="linenos">419</span></a><span class="sd">        :return: dataset with duplicated features</span>
+</span><span id="CategoricalClassification-420"><a href="#CategoricalClassification-420"><span class="linenos">420</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-421"><a href="#CategoricalClassification-421"><span class="linenos">421</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-422"><a href="#CategoricalClassification-422"><span class="linenos">422</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
 </span><span id="CategoricalClassification-423"><a href="#CategoricalClassification-423"><span class="linenos">423</span></a>
-</span><span id="CategoricalClassification-424"><a href="#CategoricalClassification-424"><span class="linenos">424</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification-424"><a href="#CategoricalClassification-424"><span class="linenos">424</span></a>        <span class="n">duplicated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">),</span> <span class="mi">1</span><span class="p">)</span>
 </span><span id="CategoricalClassification-425"><a href="#CategoricalClassification-425"><span class="linenos">425</span></a>
-</span><span id="CategoricalClassification-426"><a href="#CategoricalClassification-426"><span class="linenos">426</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="CategoricalClassification-427"><a href="#CategoricalClassification-427"><span class="linenos">427</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
-</span><span id="CategoricalClassification-428"><a href="#CategoricalClassification-428"><span class="linenos">428</span></a>            <span class="s1">&#39;duplicate_indices&#39;</span><span class="p">:</span> <span class="n">duplicated_ixs</span><span class="p">,</span>
-</span><span id="CategoricalClassification-429"><a href="#CategoricalClassification-429"><span class="linenos">429</span></a>        <span class="p">})</span>
-</span><span id="CategoricalClassification-430"><a href="#CategoricalClassification-430"><span class="linenos">430</span></a>
-</span><span id="CategoricalClassification-431"><a href="#CategoricalClassification-431"><span class="linenos">431</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">selected_features</span><span class="p">))</span>
+</span><span id="CategoricalClassification-426"><a href="#CategoricalClassification-426"><span class="linenos">426</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification-427"><a href="#CategoricalClassification-427"><span class="linenos">427</span></a>
+</span><span id="CategoricalClassification-428"><a href="#CategoricalClassification-428"><span class="linenos">428</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="CategoricalClassification-429"><a href="#CategoricalClassification-429"><span class="linenos">429</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="CategoricalClassification-430"><a href="#CategoricalClassification-430"><span class="linenos">430</span></a>            <span class="s1">&#39;duplicate_indices&#39;</span><span class="p">:</span> <span class="n">duplicated_ixs</span><span class="p">,</span>
+</span><span id="CategoricalClassification-431"><a href="#CategoricalClassification-431"><span class="linenos">431</span></a>        <span class="p">})</span>
 </span><span id="CategoricalClassification-432"><a href="#CategoricalClassification-432"><span class="linenos">432</span></a>
-</span><span id="CategoricalClassification-433"><a href="#CategoricalClassification-433"><span class="linenos">433</span></a>    <span class="k">def</span> <span class="nf">generate_labels</span><span class="p">(</span>
-</span><span id="CategoricalClassification-434"><a href="#CategoricalClassification-434"><span class="linenos">434</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification-435"><a href="#CategoricalClassification-435"><span class="linenos">435</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification-436"><a href="#CategoricalClassification-436"><span class="linenos">436</span></a>        <span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
-</span><span id="CategoricalClassification-437"><a href="#CategoricalClassification-437"><span class="linenos">437</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">|</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">=</span> <span class="mf">0.5</span><span class="p">,</span>
-</span><span id="CategoricalClassification-438"><a href="#CategoricalClassification-438"><span class="linenos">438</span></a>        <span class="n">k</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
-</span><span id="CategoricalClassification-439"><a href="#CategoricalClassification-439"><span class="linenos">439</span></a>        <span class="n">decision_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="CategoricalClassification-440"><a href="#CategoricalClassification-440"><span class="linenos">440</span></a>        <span class="n">class_relation</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
-</span><span id="CategoricalClassification-441"><a href="#CategoricalClassification-441"><span class="linenos">441</span></a>        <span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="CategoricalClassification-442"><a href="#CategoricalClassification-442"><span class="linenos">442</span></a>    <span class="p">):</span>
-</span><span id="CategoricalClassification-443"><a href="#CategoricalClassification-443"><span class="linenos">443</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-444"><a href="#CategoricalClassification-444"><span class="linenos">444</span></a><span class="sd">        Generates labels for dataset X</span>
-</span><span id="CategoricalClassification-445"><a href="#CategoricalClassification-445"><span class="linenos">445</span></a><span class="sd">        :param X: dataset</span>
-</span><span id="CategoricalClassification-446"><a href="#CategoricalClassification-446"><span class="linenos">446</span></a><span class="sd">        :param n: number of class labels</span>
-</span><span id="CategoricalClassification-447"><a href="#CategoricalClassification-447"><span class="linenos">447</span></a><span class="sd">        :param p: class distribution</span>
-</span><span id="CategoricalClassification-448"><a href="#CategoricalClassification-448"><span class="linenos">448</span></a><span class="sd">        :param k: constant</span>
-</span><span id="CategoricalClassification-449"><a href="#CategoricalClassification-449"><span class="linenos">449</span></a><span class="sd">        :param decision_function: optional user-defined decision function</span>
-</span><span id="CategoricalClassification-450"><a href="#CategoricalClassification-450"><span class="linenos">450</span></a><span class="sd">        :param class_relation: string, either &#39;linear&#39;, &#39;nonlinear&#39;, or &#39;cluster&#39;</span>
-</span><span id="CategoricalClassification-451"><a href="#CategoricalClassification-451"><span class="linenos">451</span></a><span class="sd">        :param balance: boolean, whether to balance clustering class labels</span>
-</span><span id="CategoricalClassification-452"><a href="#CategoricalClassification-452"><span class="linenos">452</span></a><span class="sd">        :return: array of labels, corresponding to dataset X</span>
-</span><span id="CategoricalClassification-453"><a href="#CategoricalClassification-453"><span class="linenos">453</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-454"><a href="#CategoricalClassification-454"><span class="linenos">454</span></a>
-</span><span id="CategoricalClassification-455"><a href="#CategoricalClassification-455"><span class="linenos">455</span></a>        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="CategoricalClassification-456"><a href="#CategoricalClassification-456"><span class="linenos">456</span></a>            <span class="k">if</span> <span class="nb">sum</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;sum of values in must be less than 1.0&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-457"><a href="#CategoricalClassification-457"><span class="linenos">457</span></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">n</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;length of p must equal n&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-433"><a href="#CategoricalClassification-433"><span class="linenos">433</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">selected_features</span><span class="p">))</span>
+</span><span id="CategoricalClassification-434"><a href="#CategoricalClassification-434"><span class="linenos">434</span></a>
+</span><span id="CategoricalClassification-435"><a href="#CategoricalClassification-435"><span class="linenos">435</span></a>    <span class="k">def</span> <span class="nf">generate_labels</span><span class="p">(</span>
+</span><span id="CategoricalClassification-436"><a href="#CategoricalClassification-436"><span class="linenos">436</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-437"><a href="#CategoricalClassification-437"><span class="linenos">437</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-438"><a href="#CategoricalClassification-438"><span class="linenos">438</span></a>        <span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
+</span><span id="CategoricalClassification-439"><a href="#CategoricalClassification-439"><span class="linenos">439</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">|</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">=</span> <span class="mf">0.5</span><span class="p">,</span>
+</span><span id="CategoricalClassification-440"><a href="#CategoricalClassification-440"><span class="linenos">440</span></a>        <span class="n">k</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
+</span><span id="CategoricalClassification-441"><a href="#CategoricalClassification-441"><span class="linenos">441</span></a>        <span class="n">decision_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification-442"><a href="#CategoricalClassification-442"><span class="linenos">442</span></a>        <span class="n">class_relation</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;linear&#39;</span><span class="p">,</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">,</span> <span class="s1">&#39;cluster&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
+</span><span id="CategoricalClassification-443"><a href="#CategoricalClassification-443"><span class="linenos">443</span></a>        <span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-444"><a href="#CategoricalClassification-444"><span class="linenos">444</span></a>        <span class="n">random_state</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
+</span><span id="CategoricalClassification-445"><a href="#CategoricalClassification-445"><span class="linenos">445</span></a>    <span class="p">):</span>
+</span><span id="CategoricalClassification-446"><a href="#CategoricalClassification-446"><span class="linenos">446</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-447"><a href="#CategoricalClassification-447"><span class="linenos">447</span></a><span class="sd">        Generates labels for dataset X</span>
+</span><span id="CategoricalClassification-448"><a href="#CategoricalClassification-448"><span class="linenos">448</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification-449"><a href="#CategoricalClassification-449"><span class="linenos">449</span></a><span class="sd">        :param n: number of class labels</span>
+</span><span id="CategoricalClassification-450"><a href="#CategoricalClassification-450"><span class="linenos">450</span></a><span class="sd">        :param p: class distribution</span>
+</span><span id="CategoricalClassification-451"><a href="#CategoricalClassification-451"><span class="linenos">451</span></a><span class="sd">        :param k: constant</span>
+</span><span id="CategoricalClassification-452"><a href="#CategoricalClassification-452"><span class="linenos">452</span></a><span class="sd">        :param decision_function: optional user-defined decision function</span>
+</span><span id="CategoricalClassification-453"><a href="#CategoricalClassification-453"><span class="linenos">453</span></a><span class="sd">        :param class_relation: string, either &#39;linear&#39;, &#39;nonlinear&#39;, or &#39;cluster&#39;</span>
+</span><span id="CategoricalClassification-454"><a href="#CategoricalClassification-454"><span class="linenos">454</span></a><span class="sd">        :param balance: boolean, whether to balance clustering class labels</span>
+</span><span id="CategoricalClassification-455"><a href="#CategoricalClassification-455"><span class="linenos">455</span></a><span class="sd">        :param random_state: seed for KMeans clustering, defaults to 42</span>
+</span><span id="CategoricalClassification-456"><a href="#CategoricalClassification-456"><span class="linenos">456</span></a><span class="sd">        :return: array of labels, corresponding to dataset X</span>
+</span><span id="CategoricalClassification-457"><a href="#CategoricalClassification-457"><span class="linenos">457</span></a><span class="sd">        &quot;&quot;&quot;</span>
 </span><span id="CategoricalClassification-458"><a href="#CategoricalClassification-458"><span class="linenos">458</span></a>
-</span><span id="CategoricalClassification-459"><a href="#CategoricalClassification-459"><span class="linenos">459</span></a>        <span class="k">if</span> <span class="n">p</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;p must be less than 1.0&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-460"><a href="#CategoricalClassification-460"><span class="linenos">460</span></a>
-</span><span id="CategoricalClassification-461"><a href="#CategoricalClassification-461"><span class="linenos">461</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification-459"><a href="#CategoricalClassification-459"><span class="linenos">459</span></a>        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-460"><a href="#CategoricalClassification-460"><span class="linenos">460</span></a>            <span class="k">if</span> <span class="nb">sum</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;sum of values in must be less than 1.0&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-461"><a href="#CategoricalClassification-461"><span class="linenos">461</span></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">n</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;length of p must equal n&#39;</span><span class="p">)</span>
 </span><span id="CategoricalClassification-462"><a href="#CategoricalClassification-462"><span class="linenos">462</span></a>
-</span><span id="CategoricalClassification-463"><a href="#CategoricalClassification-463"><span class="linenos">463</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="CategoricalClassification-464"><a href="#CategoricalClassification-464"><span class="linenos">464</span></a>            <span class="k">if</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
-</span><span id="CategoricalClassification-465"><a href="#CategoricalClassification-465"><span class="linenos">465</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="n">x</span> <span class="o">+</span> <span class="mi">3</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="CategoricalClassification-466"><a href="#CategoricalClassification-466"><span class="linenos">466</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
-</span><span id="CategoricalClassification-467"><a href="#CategoricalClassification-467"><span class="linenos">467</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="o">+</span> <span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">cos</span><span class="p">(</span><span class="n">x</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="CategoricalClassification-468"><a href="#CategoricalClassification-468"><span class="linenos">468</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;cluster&#39;</span><span class="p">:</span>
-</span><span id="CategoricalClassification-469"><a href="#CategoricalClassification-469"><span class="linenos">469</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="CategoricalClassification-470"><a href="#CategoricalClassification-470"><span class="linenos">470</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-471"><a href="#CategoricalClassification-471"><span class="linenos">471</span></a>            <span class="n">class_relation</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">decision_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
-</span><span id="CategoricalClassification-472"><a href="#CategoricalClassification-472"><span class="linenos">472</span></a>
-</span><span id="CategoricalClassification-473"><a href="#CategoricalClassification-473"><span class="linenos">473</span></a>        <span class="n">y</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="CategoricalClassification-474"><a href="#CategoricalClassification-474"><span class="linenos">474</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="CategoricalClassification-475"><a href="#CategoricalClassification-475"><span class="linenos">475</span></a>            <span class="k">if</span> <span class="n">n</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="CategoricalClassification-476"><a href="#CategoricalClassification-476"><span class="linenos">476</span></a>                <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">list</span><span class="p">:</span>
-</span><span id="CategoricalClassification-477"><a href="#CategoricalClassification-477"><span class="linenos">477</span></a>                    <span class="n">p</span> <span class="o">=</span> <span class="mi">1</span> <span class="o">/</span> <span class="n">n</span>
-</span><span id="CategoricalClassification-478"><a href="#CategoricalClassification-478"><span class="linenos">478</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">]</span>
-</span><span id="CategoricalClassification-479"><a href="#CategoricalClassification-479"><span class="linenos">479</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
-</span><span id="CategoricalClassification-480"><a href="#CategoricalClassification-480"><span class="linenos">480</span></a>                        <span class="n">percentiles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">))</span>
-</span><span id="CategoricalClassification-481"><a href="#CategoricalClassification-481"><span class="linenos">481</span></a>
-</span><span id="CategoricalClassification-482"><a href="#CategoricalClassification-482"><span class="linenos">482</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-</span><span id="CategoricalClassification-483"><a href="#CategoricalClassification-483"><span class="linenos">483</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
-</span><span id="CategoricalClassification-484"><a href="#CategoricalClassification-484"><span class="linenos">484</span></a>
-</span><span id="CategoricalClassification-485"><a href="#CategoricalClassification-485"><span class="linenos">485</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
-</span><span id="CategoricalClassification-486"><a href="#CategoricalClassification-486"><span class="linenos">486</span></a>                    <span class="k">for</span> <span class="n">p_point</span> <span class="ow">in</span> <span class="n">p_points</span><span class="p">:</span>
-</span><span id="CategoricalClassification-487"><a href="#CategoricalClassification-487"><span class="linenos">487</span></a>                        <span class="n">y</span> <span class="o">+=</span> <span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">)</span>
-</span><span id="CategoricalClassification-488"><a href="#CategoricalClassification-488"><span class="linenos">488</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-489"><a href="#CategoricalClassification-489"><span class="linenos">489</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-</span><span id="CategoricalClassification-490"><a href="#CategoricalClassification-490"><span class="linenos">490</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="o">*</span> <span class="mi">100</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">p</span><span class="p">]</span>
-</span><span id="CategoricalClassification-491"><a href="#CategoricalClassification-491"><span class="linenos">491</span></a>
-</span><span id="CategoricalClassification-492"><a href="#CategoricalClassification-492"><span class="linenos">492</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
-</span><span id="CategoricalClassification-493"><a href="#CategoricalClassification-493"><span class="linenos">493</span></a>                        <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">+=</span> <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span>
-</span><span id="CategoricalClassification-494"><a href="#CategoricalClassification-494"><span class="linenos">494</span></a>
-</span><span id="CategoricalClassification-495"><a href="#CategoricalClassification-495"><span class="linenos">495</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">insert</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
-</span><span id="CategoricalClassification-496"><a href="#CategoricalClassification-496"><span class="linenos">496</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">pop</span><span class="p">()</span>
-</span><span id="CategoricalClassification-497"><a href="#CategoricalClassification-497"><span class="linenos">497</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span>
+</span><span id="CategoricalClassification-463"><a href="#CategoricalClassification-463"><span class="linenos">463</span></a>        <span class="k">if</span> <span class="n">p</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;p must be less than 1.0&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-464"><a href="#CategoricalClassification-464"><span class="linenos">464</span></a>
+</span><span id="CategoricalClassification-465"><a href="#CategoricalClassification-465"><span class="linenos">465</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification-466"><a href="#CategoricalClassification-466"><span class="linenos">466</span></a>
+</span><span id="CategoricalClassification-467"><a href="#CategoricalClassification-467"><span class="linenos">467</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification-468"><a href="#CategoricalClassification-468"><span class="linenos">468</span></a>            <span class="k">if</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification-469"><a href="#CategoricalClassification-469"><span class="linenos">469</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="n">x</span> <span class="o">+</span> <span class="mi">3</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification-470"><a href="#CategoricalClassification-470"><span class="linenos">470</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification-471"><a href="#CategoricalClassification-471"><span class="linenos">471</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="o">+</span> <span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">cos</span><span class="p">(</span><span class="n">x</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification-472"><a href="#CategoricalClassification-472"><span class="linenos">472</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;cluster&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification-473"><a href="#CategoricalClassification-473"><span class="linenos">473</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="CategoricalClassification-474"><a href="#CategoricalClassification-474"><span class="linenos">474</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-475"><a href="#CategoricalClassification-475"><span class="linenos">475</span></a>            <span class="n">class_relation</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">decision_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
+</span><span id="CategoricalClassification-476"><a href="#CategoricalClassification-476"><span class="linenos">476</span></a>
+</span><span id="CategoricalClassification-477"><a href="#CategoricalClassification-477"><span class="linenos">477</span></a>        <span class="n">y</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification-478"><a href="#CategoricalClassification-478"><span class="linenos">478</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification-479"><a href="#CategoricalClassification-479"><span class="linenos">479</span></a>            <span class="k">if</span> <span class="n">n</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="CategoricalClassification-480"><a href="#CategoricalClassification-480"><span class="linenos">480</span></a>                <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">list</span><span class="p">:</span>
+</span><span id="CategoricalClassification-481"><a href="#CategoricalClassification-481"><span class="linenos">481</span></a>                    <span class="n">p</span> <span class="o">=</span> <span class="mi">1</span> <span class="o">/</span> <span class="n">n</span>
+</span><span id="CategoricalClassification-482"><a href="#CategoricalClassification-482"><span class="linenos">482</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">]</span>
+</span><span id="CategoricalClassification-483"><a href="#CategoricalClassification-483"><span class="linenos">483</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="CategoricalClassification-484"><a href="#CategoricalClassification-484"><span class="linenos">484</span></a>                        <span class="n">percentiles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">))</span>
+</span><span id="CategoricalClassification-485"><a href="#CategoricalClassification-485"><span class="linenos">485</span></a>
+</span><span id="CategoricalClassification-486"><a href="#CategoricalClassification-486"><span class="linenos">486</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification-487"><a href="#CategoricalClassification-487"><span class="linenos">487</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
+</span><span id="CategoricalClassification-488"><a href="#CategoricalClassification-488"><span class="linenos">488</span></a>
+</span><span id="CategoricalClassification-489"><a href="#CategoricalClassification-489"><span class="linenos">489</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="CategoricalClassification-490"><a href="#CategoricalClassification-490"><span class="linenos">490</span></a>                    <span class="k">for</span> <span class="n">p_point</span> <span class="ow">in</span> <span class="n">p_points</span><span class="p">:</span>
+</span><span id="CategoricalClassification-491"><a href="#CategoricalClassification-491"><span class="linenos">491</span></a>                        <span class="n">y</span> <span class="o">+=</span> <span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">)</span>
+</span><span id="CategoricalClassification-492"><a href="#CategoricalClassification-492"><span class="linenos">492</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-493"><a href="#CategoricalClassification-493"><span class="linenos">493</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification-494"><a href="#CategoricalClassification-494"><span class="linenos">494</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="o">*</span> <span class="mi">100</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">p</span><span class="p">]</span>
+</span><span id="CategoricalClassification-495"><a href="#CategoricalClassification-495"><span class="linenos">495</span></a>
+</span><span id="CategoricalClassification-496"><a href="#CategoricalClassification-496"><span class="linenos">496</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="CategoricalClassification-497"><a href="#CategoricalClassification-497"><span class="linenos">497</span></a>                        <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">+=</span> <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span>
 </span><span id="CategoricalClassification-498"><a href="#CategoricalClassification-498"><span class="linenos">498</span></a>
-</span><span id="CategoricalClassification-499"><a href="#CategoricalClassification-499"><span class="linenos">499</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
-</span><span id="CategoricalClassification-500"><a href="#CategoricalClassification-500"><span class="linenos">500</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">p_points</span><span class="p">)</span>
-</span><span id="CategoricalClassification-501"><a href="#CategoricalClassification-501"><span class="linenos">501</span></a>
-</span><span id="CategoricalClassification-502"><a href="#CategoricalClassification-502"><span class="linenos">502</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
-</span><span id="CategoricalClassification-503"><a href="#CategoricalClassification-503"><span class="linenos">503</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span><span class="p">):</span>
-</span><span id="CategoricalClassification-504"><a href="#CategoricalClassification-504"><span class="linenos">504</span></a>                        <span class="n">p_point</span> <span class="o">=</span> <span class="n">p_points</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
-</span><span id="CategoricalClassification-505"><a href="#CategoricalClassification-505"><span class="linenos">505</span></a>                        <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">)):</span>
-</span><span id="CategoricalClassification-506"><a href="#CategoricalClassification-506"><span class="linenos">506</span></a>                            <span class="k">if</span> <span class="n">decision_boundary</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">:</span>
-</span><span id="CategoricalClassification-507"><a href="#CategoricalClassification-507"><span class="linenos">507</span></a>                                <span class="n">y</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="CategoricalClassification-508"><a href="#CategoricalClassification-508"><span class="linenos">508</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-509"><a href="#CategoricalClassification-509"><span class="linenos">509</span></a>                <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-</span><span id="CategoricalClassification-510"><a href="#CategoricalClassification-510"><span class="linenos">510</span></a>                <span class="n">p_point</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">)</span>
-</span><span id="CategoricalClassification-511"><a href="#CategoricalClassification-511"><span class="linenos">511</span></a>                <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
-</span><span id="CategoricalClassification-512"><a href="#CategoricalClassification-512"><span class="linenos">512</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-513"><a href="#CategoricalClassification-513"><span class="linenos">513</span></a>            <span class="k">if</span> <span class="n">p</span> <span class="o">==</span> <span class="mf">0.5</span><span class="p">:</span>
-</span><span id="CategoricalClassification-514"><a href="#CategoricalClassification-514"><span class="linenos">514</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="mf">1.0</span>
-</span><span id="CategoricalClassification-515"><a href="#CategoricalClassification-515"><span class="linenos">515</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-516"><a href="#CategoricalClassification-516"><span class="linenos">516</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span><span class="p">,</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">p</span><span class="p">]</span>
-</span><span id="CategoricalClassification-517"><a href="#CategoricalClassification-517"><span class="linenos">517</span></a>            <span class="n">y</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_cluster_data</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">n</span><span class="p">,</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">,</span> <span class="n">balance</span><span class="o">=</span><span class="n">balance</span><span class="p">)</span>
-</span><span id="CategoricalClassification-518"><a href="#CategoricalClassification-518"><span class="linenos">518</span></a>
-</span><span id="CategoricalClassification-519"><a href="#CategoricalClassification-519"><span class="linenos">519</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
-</span><span id="CategoricalClassification-520"><a href="#CategoricalClassification-520"><span class="linenos">520</span></a>            <span class="s1">&#39;labels&#39;</span><span class="p">:</span> <span class="p">{</span>
-</span><span id="CategoricalClassification-521"><a href="#CategoricalClassification-521"><span class="linenos">521</span></a>                <span class="s1">&#39;class_relation&#39;</span><span class="p">:</span> <span class="n">class_relation</span><span class="p">,</span>
-</span><span id="CategoricalClassification-522"><a href="#CategoricalClassification-522"><span class="linenos">522</span></a>                <span class="s1">&#39;n_class&#39;</span><span class="p">:</span> <span class="n">n</span><span class="p">,</span>
-</span><span id="CategoricalClassification-523"><a href="#CategoricalClassification-523"><span class="linenos">523</span></a>            <span class="p">},</span>
-</span><span id="CategoricalClassification-524"><a href="#CategoricalClassification-524"><span class="linenos">524</span></a>        <span class="p">})</span>
-</span><span id="CategoricalClassification-525"><a href="#CategoricalClassification-525"><span class="linenos">525</span></a>
-</span><span id="CategoricalClassification-526"><a href="#CategoricalClassification-526"><span class="linenos">526</span></a>        <span class="k">return</span> <span class="n">y</span>
-</span><span id="CategoricalClassification-527"><a href="#CategoricalClassification-527"><span class="linenos">527</span></a>
-</span><span id="CategoricalClassification-528"><a href="#CategoricalClassification-528"><span class="linenos">528</span></a>    <span class="k">def</span> <span class="nf">_cluster_data</span><span class="p">(</span>
-</span><span id="CategoricalClassification-529"><a href="#CategoricalClassification-529"><span class="linenos">529</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification-530"><a href="#CategoricalClassification-530"><span class="linenos">530</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification-531"><a href="#CategoricalClassification-531"><span class="linenos">531</span></a>        <span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="CategoricalClassification-532"><a href="#CategoricalClassification-532"><span class="linenos">532</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">|</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mf">1.0</span><span class="p">,</span>
-</span><span id="CategoricalClassification-533"><a href="#CategoricalClassification-533"><span class="linenos">533</span></a>        <span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="CategoricalClassification-534"><a href="#CategoricalClassification-534"><span class="linenos">534</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="CategoricalClassification-535"><a href="#CategoricalClassification-535"><span class="linenos">535</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-536"><a href="#CategoricalClassification-536"><span class="linenos">536</span></a><span class="sd">        Cluster data using kmeans</span>
-</span><span id="CategoricalClassification-537"><a href="#CategoricalClassification-537"><span class="linenos">537</span></a><span class="sd">        :param X: dataset</span>
-</span><span id="CategoricalClassification-538"><a href="#CategoricalClassification-538"><span class="linenos">538</span></a><span class="sd">        :param n: number of clusters</span>
-</span><span id="CategoricalClassification-539"><a href="#CategoricalClassification-539"><span class="linenos">539</span></a><span class="sd">        :param p: class distribution</span>
-</span><span id="CategoricalClassification-540"><a href="#CategoricalClassification-540"><span class="linenos">540</span></a><span class="sd">        :param balance: balance the clusters according to p</span>
-</span><span id="CategoricalClassification-541"><a href="#CategoricalClassification-541"><span class="linenos">541</span></a><span class="sd">        :return: array of labels, corresponding to dataset X</span>
-</span><span id="CategoricalClassification-542"><a href="#CategoricalClassification-542"><span class="linenos">542</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-543"><a href="#CategoricalClassification-543"><span class="linenos">543</span></a>
-</span><span id="CategoricalClassification-544"><a href="#CategoricalClassification-544"><span class="linenos">544</span></a>        <span class="n">kmeans</span> <span class="o">=</span> <span class="n">KMeans</span><span class="p">(</span><span class="n">n_clusters</span><span class="o">=</span><span class="n">n</span><span class="p">)</span>
-</span><span id="CategoricalClassification-545"><a href="#CategoricalClassification-545"><span class="linenos">545</span></a>
-</span><span id="CategoricalClassification-546"><a href="#CategoricalClassification-546"><span class="linenos">546</span></a>        <span class="n">kmeans</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-</span><span id="CategoricalClassification-547"><a href="#CategoricalClassification-547"><span class="linenos">547</span></a>
-</span><span id="CategoricalClassification-548"><a href="#CategoricalClassification-548"><span class="linenos">548</span></a>        <span class="n">cluster_labels</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">labels_</span>
+</span><span id="CategoricalClassification-499"><a href="#CategoricalClassification-499"><span class="linenos">499</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">insert</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification-500"><a href="#CategoricalClassification-500"><span class="linenos">500</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">pop</span><span class="p">()</span>
+</span><span id="CategoricalClassification-501"><a href="#CategoricalClassification-501"><span class="linenos">501</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span>
+</span><span id="CategoricalClassification-502"><a href="#CategoricalClassification-502"><span class="linenos">502</span></a>
+</span><span id="CategoricalClassification-503"><a href="#CategoricalClassification-503"><span class="linenos">503</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
+</span><span id="CategoricalClassification-504"><a href="#CategoricalClassification-504"><span class="linenos">504</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">p_points</span><span class="p">)</span>
+</span><span id="CategoricalClassification-505"><a href="#CategoricalClassification-505"><span class="linenos">505</span></a>
+</span><span id="CategoricalClassification-506"><a href="#CategoricalClassification-506"><span class="linenos">506</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="CategoricalClassification-507"><a href="#CategoricalClassification-507"><span class="linenos">507</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span><span class="p">):</span>
+</span><span id="CategoricalClassification-508"><a href="#CategoricalClassification-508"><span class="linenos">508</span></a>                        <span class="n">p_point</span> <span class="o">=</span> <span class="n">p_points</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="CategoricalClassification-509"><a href="#CategoricalClassification-509"><span class="linenos">509</span></a>                        <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-510"><a href="#CategoricalClassification-510"><span class="linenos">510</span></a>                            <span class="k">if</span> <span class="n">decision_boundary</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">:</span>
+</span><span id="CategoricalClassification-511"><a href="#CategoricalClassification-511"><span class="linenos">511</span></a>                                <span class="n">y</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification-512"><a href="#CategoricalClassification-512"><span class="linenos">512</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-513"><a href="#CategoricalClassification-513"><span class="linenos">513</span></a>                <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification-514"><a href="#CategoricalClassification-514"><span class="linenos">514</span></a>                <span class="n">p_point</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">)</span>
+</span><span id="CategoricalClassification-515"><a href="#CategoricalClassification-515"><span class="linenos">515</span></a>                <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification-516"><a href="#CategoricalClassification-516"><span class="linenos">516</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-517"><a href="#CategoricalClassification-517"><span class="linenos">517</span></a>            <span class="k">if</span> <span class="n">p</span> <span class="o">==</span> <span class="mf">0.5</span><span class="p">:</span>
+</span><span id="CategoricalClassification-518"><a href="#CategoricalClassification-518"><span class="linenos">518</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="mf">1.0</span>
+</span><span id="CategoricalClassification-519"><a href="#CategoricalClassification-519"><span class="linenos">519</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-520"><a href="#CategoricalClassification-520"><span class="linenos">520</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span><span class="p">,</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">p</span><span class="p">]</span>
+</span><span id="CategoricalClassification-521"><a href="#CategoricalClassification-521"><span class="linenos">521</span></a>            <span class="n">y</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_cluster_data</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">n</span><span class="p">,</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">,</span> <span class="n">balance</span><span class="o">=</span><span class="n">balance</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="n">random_state</span><span class="p">)</span>
+</span><span id="CategoricalClassification-522"><a href="#CategoricalClassification-522"><span class="linenos">522</span></a>
+</span><span id="CategoricalClassification-523"><a href="#CategoricalClassification-523"><span class="linenos">523</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="CategoricalClassification-524"><a href="#CategoricalClassification-524"><span class="linenos">524</span></a>            <span class="s1">&#39;labels&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="CategoricalClassification-525"><a href="#CategoricalClassification-525"><span class="linenos">525</span></a>                <span class="s1">&#39;class_relation&#39;</span><span class="p">:</span> <span class="n">class_relation</span><span class="p">,</span>
+</span><span id="CategoricalClassification-526"><a href="#CategoricalClassification-526"><span class="linenos">526</span></a>                <span class="s1">&#39;n_class&#39;</span><span class="p">:</span> <span class="n">n</span><span class="p">,</span>
+</span><span id="CategoricalClassification-527"><a href="#CategoricalClassification-527"><span class="linenos">527</span></a>            <span class="p">},</span>
+</span><span id="CategoricalClassification-528"><a href="#CategoricalClassification-528"><span class="linenos">528</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification-529"><a href="#CategoricalClassification-529"><span class="linenos">529</span></a>
+</span><span id="CategoricalClassification-530"><a href="#CategoricalClassification-530"><span class="linenos">530</span></a>        <span class="k">return</span> <span class="n">y</span>
+</span><span id="CategoricalClassification-531"><a href="#CategoricalClassification-531"><span class="linenos">531</span></a>
+</span><span id="CategoricalClassification-532"><a href="#CategoricalClassification-532"><span class="linenos">532</span></a>    <span class="k">def</span> <span class="nf">_cluster_data</span><span class="p">(</span>
+</span><span id="CategoricalClassification-533"><a href="#CategoricalClassification-533"><span class="linenos">533</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-534"><a href="#CategoricalClassification-534"><span class="linenos">534</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-535"><a href="#CategoricalClassification-535"><span class="linenos">535</span></a>        <span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="CategoricalClassification-536"><a href="#CategoricalClassification-536"><span class="linenos">536</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">|</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mf">1.0</span><span class="p">,</span>
+</span><span id="CategoricalClassification-537"><a href="#CategoricalClassification-537"><span class="linenos">537</span></a>        <span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-538"><a href="#CategoricalClassification-538"><span class="linenos">538</span></a>        <span class="n">random_state</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
+</span><span id="CategoricalClassification-539"><a href="#CategoricalClassification-539"><span class="linenos">539</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-540"><a href="#CategoricalClassification-540"><span class="linenos">540</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-541"><a href="#CategoricalClassification-541"><span class="linenos">541</span></a><span class="sd">        Cluster data using kmeans</span>
+</span><span id="CategoricalClassification-542"><a href="#CategoricalClassification-542"><span class="linenos">542</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification-543"><a href="#CategoricalClassification-543"><span class="linenos">543</span></a><span class="sd">        :param n: number of clusters</span>
+</span><span id="CategoricalClassification-544"><a href="#CategoricalClassification-544"><span class="linenos">544</span></a><span class="sd">        :param p: class distribution</span>
+</span><span id="CategoricalClassification-545"><a href="#CategoricalClassification-545"><span class="linenos">545</span></a><span class="sd">        :param balance: balance the clusters according to p</span>
+</span><span id="CategoricalClassification-546"><a href="#CategoricalClassification-546"><span class="linenos">546</span></a><span class="sd">        :random_state: seed for KMeans clustering, defaults to 42</span>
+</span><span id="CategoricalClassification-547"><a href="#CategoricalClassification-547"><span class="linenos">547</span></a><span class="sd">        :return: array of labels, corresponding to dataset X</span>
+</span><span id="CategoricalClassification-548"><a href="#CategoricalClassification-548"><span class="linenos">548</span></a><span class="sd">        &quot;&quot;&quot;</span>
 </span><span id="CategoricalClassification-549"><a href="#CategoricalClassification-549"><span class="linenos">549</span></a>
-</span><span id="CategoricalClassification-550"><a href="#CategoricalClassification-550"><span class="linenos">550</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>  <span class="c1"># Fully balanced clusters</span>
-</span><span id="CategoricalClassification-551"><a href="#CategoricalClassification-551"><span class="linenos">551</span></a>            <span class="n">samples_per_cluster</span> <span class="o">=</span> <span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">)</span> <span class="o">//</span> <span class="n">n</span><span class="p">]</span> <span class="o">*</span> <span class="n">n</span>
-</span><span id="CategoricalClassification-552"><a href="#CategoricalClassification-552"><span class="linenos">552</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-553"><a href="#CategoricalClassification-553"><span class="linenos">553</span></a>            <span class="n">samples</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-</span><span id="CategoricalClassification-554"><a href="#CategoricalClassification-554"><span class="linenos">554</span></a>            <span class="n">samples_per_cluster</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="CategoricalClassification-555"><a href="#CategoricalClassification-555"><span class="linenos">555</span></a>            <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="CategoricalClassification-556"><a href="#CategoricalClassification-556"><span class="linenos">556</span></a>                <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span> <span class="o">//</span> <span class="n">n</span><span class="p">)</span>
-</span><span id="CategoricalClassification-557"><a href="#CategoricalClassification-557"><span class="linenos">557</span></a>                <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="p">(</span><span class="mi">1</span> <span class="o">-</span> <span class="n">p</span><span class="p">))</span> <span class="o">//</span> <span class="n">n</span><span class="p">)</span>
-</span><span id="CategoricalClassification-558"><a href="#CategoricalClassification-558"><span class="linenos">558</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-559"><a href="#CategoricalClassification-559"><span class="linenos">559</span></a>                <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">==</span> <span class="n">n</span><span class="p">:</span>
-</span><span id="CategoricalClassification-560"><a href="#CategoricalClassification-560"><span class="linenos">560</span></a>                    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">p</span><span class="p">:</span>
-</span><span id="CategoricalClassification-561"><a href="#CategoricalClassification-561"><span class="linenos">561</span></a>                        <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="n">val</span><span class="p">))</span>
-</span><span id="CategoricalClassification-562"><a href="#CategoricalClassification-562"><span class="linenos">562</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-563"><a href="#CategoricalClassification-563"><span class="linenos">563</span></a>                    <span class="k">raise</span> <span class="ne">Exception</span><span class="p">(</span><span class="s1">&#39;Length of balance parameter must equal number of clusters.&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-564"><a href="#CategoricalClassification-564"><span class="linenos">564</span></a>
-</span><span id="CategoricalClassification-565"><a href="#CategoricalClassification-565"><span class="linenos">565</span></a>        <span class="c1"># Adjust cluster sizes</span>
-</span><span id="CategoricalClassification-566"><a href="#CategoricalClassification-566"><span class="linenos">566</span></a>        <span class="k">if</span> <span class="n">balance</span><span class="p">:</span>
-</span><span id="CategoricalClassification-567"><a href="#CategoricalClassification-567"><span class="linenos">567</span></a>            <span class="n">adjustments</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="CategoricalClassification-568"><a href="#CategoricalClassification-568"><span class="linenos">568</span></a>            <span class="n">overflow_samples</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="CategoricalClassification-569"><a href="#CategoricalClassification-569"><span class="linenos">569</span></a>            <span class="n">overflow_indices</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="CategoricalClassification-570"><a href="#CategoricalClassification-570"><span class="linenos">570</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">):</span>
-</span><span id="CategoricalClassification-571"><a href="#CategoricalClassification-571"><span class="linenos">571</span></a>                <span class="n">cluster_size</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">cluster_labels</span> <span class="o">==</span> <span class="n">i</span><span class="p">)</span>
-</span><span id="CategoricalClassification-572"><a href="#CategoricalClassification-572"><span class="linenos">572</span></a>
-</span><span id="CategoricalClassification-573"><a href="#CategoricalClassification-573"><span class="linenos">573</span></a>                <span class="n">adjustment</span> <span class="o">=</span> <span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">-</span> <span class="n">cluster_size</span>
-</span><span id="CategoricalClassification-574"><a href="#CategoricalClassification-574"><span class="linenos">574</span></a>                <span class="n">adjustments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">adjustment</span><span class="p">)</span>
-</span><span id="CategoricalClassification-575"><a href="#CategoricalClassification-575"><span class="linenos">575</span></a>
-</span><span id="CategoricalClassification-576"><a href="#CategoricalClassification-576"><span class="linenos">576</span></a>                <span class="k">if</span> <span class="n">adjustment</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">:</span>  <span class="c1"># Cluter is too large</span>
-</span><span id="CategoricalClassification-577"><a href="#CategoricalClassification-577"><span class="linenos">577</span></a>
-</span><span id="CategoricalClassification-578"><a href="#CategoricalClassification-578"><span class="linenos">578</span></a>                    <span class="n">centroid</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">cluster_centers_</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
-</span><span id="CategoricalClassification-579"><a href="#CategoricalClassification-579"><span class="linenos">579</span></a>                    <span class="n">dataset_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">cluster_labels</span> <span class="o">==</span> <span class="n">i</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>  <span class="c1"># Indices of samples in dataset</span>
-</span><span id="CategoricalClassification-580"><a href="#CategoricalClassification-580"><span class="linenos">580</span></a>                    <span class="n">cluster_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="n">dataset_indices</span><span class="p">])</span>
-</span><span id="CategoricalClassification-581"><a href="#CategoricalClassification-581"><span class="linenos">581</span></a>
-</span><span id="CategoricalClassification-582"><a href="#CategoricalClassification-582"><span class="linenos">582</span></a>                    <span class="n">distances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">linalg</span><span class="o">.</span><span class="n">norm</span><span class="p">(</span>
-</span><span id="CategoricalClassification-583"><a href="#CategoricalClassification-583"><span class="linenos">583</span></a>                        <span class="n">cluster_samples</span> <span class="o">-</span> <span class="n">centroid</span><span class="p">,</span>
-</span><span id="CategoricalClassification-584"><a href="#CategoricalClassification-584"><span class="linenos">584</span></a>                        <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-</span><span id="CategoricalClassification-585"><a href="#CategoricalClassification-585"><span class="linenos">585</span></a>                    <span class="p">)</span>  <span class="c1"># Distances of cluster samples to cluster centroid</span>
-</span><span id="CategoricalClassification-586"><a href="#CategoricalClassification-586"><span class="linenos">586</span></a>                    <span class="n">cluster_sample_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">distances</span><span class="p">)</span>
-</span><span id="CategoricalClassification-587"><a href="#CategoricalClassification-587"><span class="linenos">587</span></a>                    <span class="n">dataset_indices_sorted</span> <span class="o">=</span> <span class="n">dataset_indices</span><span class="p">[</span>
-</span><span id="CategoricalClassification-588"><a href="#CategoricalClassification-588"><span class="linenos">588</span></a>                        <span class="n">cluster_sample_indices</span>
-</span><span id="CategoricalClassification-589"><a href="#CategoricalClassification-589"><span class="linenos">589</span></a>                    <span class="p">]</span>  <span class="c1"># Indices of samples sorted by sample distance to cluster centroid</span>
-</span><span id="CategoricalClassification-590"><a href="#CategoricalClassification-590"><span class="linenos">590</span></a>
-</span><span id="CategoricalClassification-591"><a href="#CategoricalClassification-591"><span class="linenos">591</span></a>                    <span class="n">overflow_sample_indices</span> <span class="o">=</span> <span class="n">cluster_sample_indices</span><span class="p">[</span><span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]:]</span>  <span class="c1"># Overflow samples</span>
-</span><span id="CategoricalClassification-592"><a href="#CategoricalClassification-592"><span class="linenos">592</span></a>                    <span class="n">dataset_indices_sorted</span> <span class="o">=</span> <span class="n">dataset_indices_sorted</span><span class="p">[</span>
-</span><span id="CategoricalClassification-593"><a href="#CategoricalClassification-593"><span class="linenos">593</span></a>                                             <span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]:</span>
-</span><span id="CategoricalClassification-594"><a href="#CategoricalClassification-594"><span class="linenos">594</span></a>                    <span class="p">]</span>  <span class="c1"># Dataset indices of overflow samples</span>
-</span><span id="CategoricalClassification-595"><a href="#CategoricalClassification-595"><span class="linenos">595</span></a>
-</span><span id="CategoricalClassification-596"><a href="#CategoricalClassification-596"><span class="linenos">596</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">overflow_sample_indices</span><span class="p">)):</span>
-</span><span id="CategoricalClassification-597"><a href="#CategoricalClassification-597"><span class="linenos">597</span></a>                        <span class="n">overflow_samples</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster_samples</span><span class="p">[</span><span class="n">overflow_sample_indices</span><span class="p">[</span><span class="n">i</span><span class="p">]])</span>
-</span><span id="CategoricalClassification-598"><a href="#CategoricalClassification-598"><span class="linenos">598</span></a>                        <span class="n">overflow_indices</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">dataset_indices_sorted</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
-</span><span id="CategoricalClassification-599"><a href="#CategoricalClassification-599"><span class="linenos">599</span></a>
-</span><span id="CategoricalClassification-600"><a href="#CategoricalClassification-600"><span class="linenos">600</span></a>            <span class="n">overflow_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">overflow_samples</span><span class="p">)</span>
-</span><span id="CategoricalClassification-601"><a href="#CategoricalClassification-601"><span class="linenos">601</span></a>            <span class="n">overflow_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">overflow_indices</span><span class="p">)</span>
-</span><span id="CategoricalClassification-602"><a href="#CategoricalClassification-602"><span class="linenos">602</span></a>
-</span><span id="CategoricalClassification-603"><a href="#CategoricalClassification-603"><span class="linenos">603</span></a>            <span class="c1"># Making adjustments</span>
-</span><span id="CategoricalClassification-604"><a href="#CategoricalClassification-604"><span class="linenos">604</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">):</span>
-</span><span id="CategoricalClassification-605"><a href="#CategoricalClassification-605"><span class="linenos">605</span></a>
-</span><span id="CategoricalClassification-606"><a href="#CategoricalClassification-606"><span class="linenos">606</span></a>                <span class="k">if</span> <span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="CategoricalClassification-607"><a href="#CategoricalClassification-607"><span class="linenos">607</span></a>                    <span class="n">centroid</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">cluster_centers_</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
-</span><span id="CategoricalClassification-608"><a href="#CategoricalClassification-608"><span class="linenos">608</span></a>                    <span class="n">distances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">linalg</span><span class="o">.</span><span class="n">norm</span><span class="p">(</span><span class="n">overflow_samples</span> <span class="o">-</span> <span class="n">centroid</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="CategoricalClassification-609"><a href="#CategoricalClassification-609"><span class="linenos">609</span></a>
-</span><span id="CategoricalClassification-610"><a href="#CategoricalClassification-610"><span class="linenos">610</span></a>                    <span class="n">closest_sample_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">distances</span><span class="p">)</span>
-</span><span id="CategoricalClassification-611"><a href="#CategoricalClassification-611"><span class="linenos">611</span></a>
-</span><span id="CategoricalClassification-612"><a href="#CategoricalClassification-612"><span class="linenos">612</span></a>                    <span class="n">overflow_indices_sorted</span> <span class="o">=</span> <span class="n">overflow_indices</span><span class="p">[</span><span class="n">closest_sample_indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification-550"><a href="#CategoricalClassification-550"><span class="linenos">550</span></a>        <span class="n">kmeans</span> <span class="o">=</span> <span class="n">KMeans</span><span class="p">(</span><span class="n">n_clusters</span><span class="o">=</span><span class="n">n</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="n">random_state</span><span class="p">)</span>
+</span><span id="CategoricalClassification-551"><a href="#CategoricalClassification-551"><span class="linenos">551</span></a>
+</span><span id="CategoricalClassification-552"><a href="#CategoricalClassification-552"><span class="linenos">552</span></a>        <span class="n">kmeans</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification-553"><a href="#CategoricalClassification-553"><span class="linenos">553</span></a>
+</span><span id="CategoricalClassification-554"><a href="#CategoricalClassification-554"><span class="linenos">554</span></a>        <span class="n">cluster_labels</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">labels_</span>
+</span><span id="CategoricalClassification-555"><a href="#CategoricalClassification-555"><span class="linenos">555</span></a>
+</span><span id="CategoricalClassification-556"><a href="#CategoricalClassification-556"><span class="linenos">556</span></a>        <span class="c1"># Fully balanced clusters</span>
+</span><span id="CategoricalClassification-557"><a href="#CategoricalClassification-557"><span class="linenos">557</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-558"><a href="#CategoricalClassification-558"><span class="linenos">558</span></a>            <span class="n">samples_per_cluster</span> <span class="o">=</span> <span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">)</span> <span class="o">//</span> <span class="n">n</span><span class="p">]</span> <span class="o">*</span> <span class="n">n</span>
+</span><span id="CategoricalClassification-559"><a href="#CategoricalClassification-559"><span class="linenos">559</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-560"><a href="#CategoricalClassification-560"><span class="linenos">560</span></a>            <span class="n">samples</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification-561"><a href="#CategoricalClassification-561"><span class="linenos">561</span></a>            <span class="n">samples_per_cluster</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification-562"><a href="#CategoricalClassification-562"><span class="linenos">562</span></a>            <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-563"><a href="#CategoricalClassification-563"><span class="linenos">563</span></a>                <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span> <span class="o">//</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="CategoricalClassification-564"><a href="#CategoricalClassification-564"><span class="linenos">564</span></a>                <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="p">(</span><span class="mi">1</span> <span class="o">-</span> <span class="n">p</span><span class="p">))</span> <span class="o">//</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="CategoricalClassification-565"><a href="#CategoricalClassification-565"><span class="linenos">565</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-566"><a href="#CategoricalClassification-566"><span class="linenos">566</span></a>                <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">==</span> <span class="n">n</span><span class="p">:</span>
+</span><span id="CategoricalClassification-567"><a href="#CategoricalClassification-567"><span class="linenos">567</span></a>                    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">p</span><span class="p">:</span>
+</span><span id="CategoricalClassification-568"><a href="#CategoricalClassification-568"><span class="linenos">568</span></a>                        <span class="n">samples_per_cluster</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">samples</span> <span class="o">*</span> <span class="n">val</span><span class="p">))</span>
+</span><span id="CategoricalClassification-569"><a href="#CategoricalClassification-569"><span class="linenos">569</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-570"><a href="#CategoricalClassification-570"><span class="linenos">570</span></a>                    <span class="k">raise</span> <span class="ne">Exception</span><span class="p">(</span><span class="s1">&#39;Length of balance parameter must equal number of clusters.&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-571"><a href="#CategoricalClassification-571"><span class="linenos">571</span></a>
+</span><span id="CategoricalClassification-572"><a href="#CategoricalClassification-572"><span class="linenos">572</span></a>        <span class="c1"># Adjust cluster sizes</span>
+</span><span id="CategoricalClassification-573"><a href="#CategoricalClassification-573"><span class="linenos">573</span></a>        <span class="k">if</span> <span class="n">balance</span><span class="p">:</span>
+</span><span id="CategoricalClassification-574"><a href="#CategoricalClassification-574"><span class="linenos">574</span></a>            <span class="n">adjustments</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification-575"><a href="#CategoricalClassification-575"><span class="linenos">575</span></a>            <span class="n">overflow_samples</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification-576"><a href="#CategoricalClassification-576"><span class="linenos">576</span></a>            <span class="n">overflow_indices</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification-577"><a href="#CategoricalClassification-577"><span class="linenos">577</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">):</span>
+</span><span id="CategoricalClassification-578"><a href="#CategoricalClassification-578"><span class="linenos">578</span></a>                <span class="n">cluster_size</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">cluster_labels</span> <span class="o">==</span> <span class="n">i</span><span class="p">)</span>
+</span><span id="CategoricalClassification-579"><a href="#CategoricalClassification-579"><span class="linenos">579</span></a>
+</span><span id="CategoricalClassification-580"><a href="#CategoricalClassification-580"><span class="linenos">580</span></a>                <span class="n">adjustment</span> <span class="o">=</span> <span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">-</span> <span class="n">cluster_size</span>
+</span><span id="CategoricalClassification-581"><a href="#CategoricalClassification-581"><span class="linenos">581</span></a>                <span class="n">adjustments</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">adjustment</span><span class="p">)</span>
+</span><span id="CategoricalClassification-582"><a href="#CategoricalClassification-582"><span class="linenos">582</span></a>
+</span><span id="CategoricalClassification-583"><a href="#CategoricalClassification-583"><span class="linenos">583</span></a>                <span class="c1"># Cluster is too large</span>
+</span><span id="CategoricalClassification-584"><a href="#CategoricalClassification-584"><span class="linenos">584</span></a>                <span class="k">if</span> <span class="n">adjustment</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification-585"><a href="#CategoricalClassification-585"><span class="linenos">585</span></a>                    <span class="n">centroid</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">cluster_centers_</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="CategoricalClassification-586"><a href="#CategoricalClassification-586"><span class="linenos">586</span></a>                    <span class="c1"># Indices of samples in dataset</span>
+</span><span id="CategoricalClassification-587"><a href="#CategoricalClassification-587"><span class="linenos">587</span></a>                    <span class="n">dataset_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">cluster_labels</span> <span class="o">==</span> <span class="n">i</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="CategoricalClassification-588"><a href="#CategoricalClassification-588"><span class="linenos">588</span></a>                    <span class="n">cluster_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="n">dataset_indices</span><span class="p">])</span>
+</span><span id="CategoricalClassification-589"><a href="#CategoricalClassification-589"><span class="linenos">589</span></a>
+</span><span id="CategoricalClassification-590"><a href="#CategoricalClassification-590"><span class="linenos">590</span></a>                    <span class="n">distances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">linalg</span><span class="o">.</span><span class="n">norm</span><span class="p">(</span>
+</span><span id="CategoricalClassification-591"><a href="#CategoricalClassification-591"><span class="linenos">591</span></a>                        <span class="n">cluster_samples</span> <span class="o">-</span> <span class="n">centroid</span><span class="p">,</span>
+</span><span id="CategoricalClassification-592"><a href="#CategoricalClassification-592"><span class="linenos">592</span></a>                        <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="CategoricalClassification-593"><a href="#CategoricalClassification-593"><span class="linenos">593</span></a>                    <span class="p">)</span>  <span class="c1"># Distances of cluster samples to cluster centroid</span>
+</span><span id="CategoricalClassification-594"><a href="#CategoricalClassification-594"><span class="linenos">594</span></a>                    <span class="n">cluster_sample_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">distances</span><span class="p">)</span>
+</span><span id="CategoricalClassification-595"><a href="#CategoricalClassification-595"><span class="linenos">595</span></a>                    <span class="n">dataset_indices_sorted</span> <span class="o">=</span> <span class="n">dataset_indices</span><span class="p">[</span>
+</span><span id="CategoricalClassification-596"><a href="#CategoricalClassification-596"><span class="linenos">596</span></a>                        <span class="n">cluster_sample_indices</span>
+</span><span id="CategoricalClassification-597"><a href="#CategoricalClassification-597"><span class="linenos">597</span></a>                    <span class="p">]</span>  <span class="c1"># Indices of samples sorted by sample distance to cluster centroid</span>
+</span><span id="CategoricalClassification-598"><a href="#CategoricalClassification-598"><span class="linenos">598</span></a>
+</span><span id="CategoricalClassification-599"><a href="#CategoricalClassification-599"><span class="linenos">599</span></a>                    <span class="n">overflow_sample_indices</span> <span class="o">=</span> <span class="n">cluster_sample_indices</span><span class="p">[</span><span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]:]</span>  <span class="c1"># Overflow samples</span>
+</span><span id="CategoricalClassification-600"><a href="#CategoricalClassification-600"><span class="linenos">600</span></a>                    <span class="n">dataset_indices_sorted</span> <span class="o">=</span> <span class="n">dataset_indices_sorted</span><span class="p">[</span>
+</span><span id="CategoricalClassification-601"><a href="#CategoricalClassification-601"><span class="linenos">601</span></a>                                             <span class="n">samples_per_cluster</span><span class="p">[</span><span class="n">i</span><span class="p">]:</span>
+</span><span id="CategoricalClassification-602"><a href="#CategoricalClassification-602"><span class="linenos">602</span></a>                    <span class="p">]</span>  <span class="c1"># Dataset indices of overflow samples</span>
+</span><span id="CategoricalClassification-603"><a href="#CategoricalClassification-603"><span class="linenos">603</span></a>
+</span><span id="CategoricalClassification-604"><a href="#CategoricalClassification-604"><span class="linenos">604</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">overflow_sample_indices</span><span class="p">)):</span>
+</span><span id="CategoricalClassification-605"><a href="#CategoricalClassification-605"><span class="linenos">605</span></a>                        <span class="n">overflow_samples</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">cluster_samples</span><span class="p">[</span><span class="n">overflow_sample_indices</span><span class="p">[</span><span class="n">i</span><span class="p">]])</span>
+</span><span id="CategoricalClassification-606"><a href="#CategoricalClassification-606"><span class="linenos">606</span></a>                        <span class="n">overflow_indices</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">dataset_indices_sorted</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
+</span><span id="CategoricalClassification-607"><a href="#CategoricalClassification-607"><span class="linenos">607</span></a>
+</span><span id="CategoricalClassification-608"><a href="#CategoricalClassification-608"><span class="linenos">608</span></a>            <span class="n">overflow_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">overflow_samples</span><span class="p">)</span>
+</span><span id="CategoricalClassification-609"><a href="#CategoricalClassification-609"><span class="linenos">609</span></a>            <span class="n">overflow_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">overflow_indices</span><span class="p">)</span>
+</span><span id="CategoricalClassification-610"><a href="#CategoricalClassification-610"><span class="linenos">610</span></a>
+</span><span id="CategoricalClassification-611"><a href="#CategoricalClassification-611"><span class="linenos">611</span></a>            <span class="c1"># Making adjustments</span>
+</span><span id="CategoricalClassification-612"><a href="#CategoricalClassification-612"><span class="linenos">612</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">):</span>
 </span><span id="CategoricalClassification-613"><a href="#CategoricalClassification-613"><span class="linenos">613</span></a>
-</span><span id="CategoricalClassification-614"><a href="#CategoricalClassification-614"><span class="linenos">614</span></a>                    <span class="n">sample_indices_slice</span> <span class="o">=</span> <span class="n">closest_sample_indices</span><span class="p">[:</span><span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span>
-</span><span id="CategoricalClassification-615"><a href="#CategoricalClassification-615"><span class="linenos">615</span></a>                    <span class="n">overflow_indices_slice</span> <span class="o">=</span> <span class="n">overflow_indices_sorted</span><span class="p">[:</span><span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span>
-</span><span id="CategoricalClassification-616"><a href="#CategoricalClassification-616"><span class="linenos">616</span></a>
-</span><span id="CategoricalClassification-617"><a href="#CategoricalClassification-617"><span class="linenos">617</span></a>                    <span class="n">cluster_labels</span><span class="p">[</span><span class="n">overflow_indices_slice</span><span class="p">]</span> <span class="o">=</span> <span class="n">i</span>
-</span><span id="CategoricalClassification-618"><a href="#CategoricalClassification-618"><span class="linenos">618</span></a>
-</span><span id="CategoricalClassification-619"><a href="#CategoricalClassification-619"><span class="linenos">619</span></a>                    <span class="n">overflow_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">delete</span><span class="p">(</span><span class="n">overflow_samples</span><span class="p">,</span> <span class="n">sample_indices_slice</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="CategoricalClassification-620"><a href="#CategoricalClassification-620"><span class="linenos">620</span></a>                    <span class="n">overflow_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">delete</span><span class="p">(</span><span class="n">overflow_indices</span><span class="p">,</span> <span class="n">sample_indices_slice</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification-614"><a href="#CategoricalClassification-614"><span class="linenos">614</span></a>                <span class="k">if</span> <span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification-615"><a href="#CategoricalClassification-615"><span class="linenos">615</span></a>                    <span class="n">centroid</span> <span class="o">=</span> <span class="n">kmeans</span><span class="o">.</span><span class="n">cluster_centers_</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="CategoricalClassification-616"><a href="#CategoricalClassification-616"><span class="linenos">616</span></a>                    <span class="n">distances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">linalg</span><span class="o">.</span><span class="n">norm</span><span class="p">(</span><span class="n">overflow_samples</span> <span class="o">-</span> <span class="n">centroid</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification-617"><a href="#CategoricalClassification-617"><span class="linenos">617</span></a>
+</span><span id="CategoricalClassification-618"><a href="#CategoricalClassification-618"><span class="linenos">618</span></a>                    <span class="n">closest_sample_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">distances</span><span class="p">)</span>
+</span><span id="CategoricalClassification-619"><a href="#CategoricalClassification-619"><span class="linenos">619</span></a>
+</span><span id="CategoricalClassification-620"><a href="#CategoricalClassification-620"><span class="linenos">620</span></a>                    <span class="n">overflow_indices_sorted</span> <span class="o">=</span> <span class="n">overflow_indices</span><span class="p">[</span><span class="n">closest_sample_indices</span><span class="p">]</span>
 </span><span id="CategoricalClassification-621"><a href="#CategoricalClassification-621"><span class="linenos">621</span></a>
-</span><span id="CategoricalClassification-622"><a href="#CategoricalClassification-622"><span class="linenos">622</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">cluster_labels</span><span class="p">)</span>
-</span><span id="CategoricalClassification-623"><a href="#CategoricalClassification-623"><span class="linenos">623</span></a>
-</span><span id="CategoricalClassification-624"><a href="#CategoricalClassification-624"><span class="linenos">624</span></a>    <span class="k">def</span> <span class="nf">generate_noise</span><span class="p">(</span>
-</span><span id="CategoricalClassification-625"><a href="#CategoricalClassification-625"><span class="linenos">625</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification-626"><a href="#CategoricalClassification-626"><span class="linenos">626</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification-627"><a href="#CategoricalClassification-627"><span class="linenos">627</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification-628"><a href="#CategoricalClassification-628"><span class="linenos">628</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.2</span><span class="p">,</span>
-</span><span id="CategoricalClassification-629"><a href="#CategoricalClassification-629"><span class="linenos">629</span></a>        <span class="nb">type</span><span class="p">:</span> <span class="n">Literal</span> <span class="o">=</span> <span class="s1">&#39;categorical&#39;</span><span class="p">,</span>
-</span><span id="CategoricalClassification-630"><a href="#CategoricalClassification-630"><span class="linenos">630</span></a>        <span class="n">missing_val</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;-inf&#39;</span><span class="p">),</span>
-</span><span id="CategoricalClassification-631"><a href="#CategoricalClassification-631"><span class="linenos">631</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="CategoricalClassification-632"><a href="#CategoricalClassification-632"><span class="linenos">632</span></a>
-</span><span id="CategoricalClassification-633"><a href="#CategoricalClassification-633"><span class="linenos">633</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-634"><a href="#CategoricalClassification-634"><span class="linenos">634</span></a><span class="sd">        Simulates noise on given dataset X</span>
-</span><span id="CategoricalClassification-635"><a href="#CategoricalClassification-635"><span class="linenos">635</span></a><span class="sd">        :param X: dataset to apply noise to</span>
-</span><span id="CategoricalClassification-636"><a href="#CategoricalClassification-636"><span class="linenos">636</span></a><span class="sd">        :param y: required target labels for categorical noise generation</span>
-</span><span id="CategoricalClassification-637"><a href="#CategoricalClassification-637"><span class="linenos">637</span></a><span class="sd">        :param p: amount of noise to apply. Defaults to 0.2</span>
-</span><span id="CategoricalClassification-638"><a href="#CategoricalClassification-638"><span class="linenos">638</span></a><span class="sd">        :param type: type of noise to apply, either categorical or missing</span>
-</span><span id="CategoricalClassification-639"><a href="#CategoricalClassification-639"><span class="linenos">639</span></a><span class="sd">        :param missing_val: value to simulate missing values. Defaults to float(&#39;-inf&#39;)</span>
-</span><span id="CategoricalClassification-640"><a href="#CategoricalClassification-640"><span class="linenos">640</span></a><span class="sd">        :return: X with noise applied</span>
-</span><span id="CategoricalClassification-641"><a href="#CategoricalClassification-641"><span class="linenos">641</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-642"><a href="#CategoricalClassification-642"><span class="linenos">642</span></a>
-</span><span id="CategoricalClassification-643"><a href="#CategoricalClassification-643"><span class="linenos">643</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="CategoricalClassification-644"><a href="#CategoricalClassification-644"><span class="linenos">644</span></a>            <span class="s1">&#39;type&#39;</span><span class="p">:</span> <span class="nb">type</span><span class="p">,</span>
-</span><span id="CategoricalClassification-645"><a href="#CategoricalClassification-645"><span class="linenos">645</span></a>            <span class="s1">&#39;amount&#39;</span><span class="p">:</span> <span class="n">p</span><span class="p">,</span>
-</span><span id="CategoricalClassification-646"><a href="#CategoricalClassification-646"><span class="linenos">646</span></a>        <span class="p">})</span>
-</span><span id="CategoricalClassification-647"><a href="#CategoricalClassification-647"><span class="linenos">647</span></a>
-</span><span id="CategoricalClassification-648"><a href="#CategoricalClassification-648"><span class="linenos">648</span></a>        <span class="k">if</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;categorical&#39;</span><span class="p">:</span>
-</span><span id="CategoricalClassification-649"><a href="#CategoricalClassification-649"><span class="linenos">649</span></a>            <span class="n">label_values</span><span class="p">,</span> <span class="n">label_count</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="CategoricalClassification-650"><a href="#CategoricalClassification-650"><span class="linenos">650</span></a>            <span class="n">n_labels</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">label_values</span><span class="p">)</span>
-</span><span id="CategoricalClassification-651"><a href="#CategoricalClassification-651"><span class="linenos">651</span></a>
-</span><span id="CategoricalClassification-652"><a href="#CategoricalClassification-652"><span class="linenos">652</span></a>            <span class="n">inds</span> <span class="o">=</span> <span class="n">y</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
-</span><span id="CategoricalClassification-653"><a href="#CategoricalClassification-653"><span class="linenos">653</span></a>            <span class="n">y_sort</span> <span class="o">=</span> <span class="n">y</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
-</span><span id="CategoricalClassification-654"><a href="#CategoricalClassification-654"><span class="linenos">654</span></a>            <span class="n">X_sort</span> <span class="o">=</span> <span class="n">X</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
+</span><span id="CategoricalClassification-622"><a href="#CategoricalClassification-622"><span class="linenos">622</span></a>                    <span class="n">sample_indices_slice</span> <span class="o">=</span> <span class="n">closest_sample_indices</span><span class="p">[:</span><span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span>
+</span><span id="CategoricalClassification-623"><a href="#CategoricalClassification-623"><span class="linenos">623</span></a>                    <span class="n">overflow_indices_slice</span> <span class="o">=</span> <span class="n">overflow_indices_sorted</span><span class="p">[:</span><span class="n">adjustments</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span>
+</span><span id="CategoricalClassification-624"><a href="#CategoricalClassification-624"><span class="linenos">624</span></a>
+</span><span id="CategoricalClassification-625"><a href="#CategoricalClassification-625"><span class="linenos">625</span></a>                    <span class="n">cluster_labels</span><span class="p">[</span><span class="n">overflow_indices_slice</span><span class="p">]</span> <span class="o">=</span> <span class="n">i</span>
+</span><span id="CategoricalClassification-626"><a href="#CategoricalClassification-626"><span class="linenos">626</span></a>
+</span><span id="CategoricalClassification-627"><a href="#CategoricalClassification-627"><span class="linenos">627</span></a>                    <span class="n">overflow_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">delete</span><span class="p">(</span><span class="n">overflow_samples</span><span class="p">,</span> <span class="n">sample_indices_slice</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification-628"><a href="#CategoricalClassification-628"><span class="linenos">628</span></a>                    <span class="n">overflow_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">delete</span><span class="p">(</span><span class="n">overflow_indices</span><span class="p">,</span> <span class="n">sample_indices_slice</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification-629"><a href="#CategoricalClassification-629"><span class="linenos">629</span></a>
+</span><span id="CategoricalClassification-630"><a href="#CategoricalClassification-630"><span class="linenos">630</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">cluster_labels</span><span class="p">)</span>
+</span><span id="CategoricalClassification-631"><a href="#CategoricalClassification-631"><span class="linenos">631</span></a>
+</span><span id="CategoricalClassification-632"><a href="#CategoricalClassification-632"><span class="linenos">632</span></a>    <span class="k">def</span> <span class="nf">generate_noise</span><span class="p">(</span>
+</span><span id="CategoricalClassification-633"><a href="#CategoricalClassification-633"><span class="linenos">633</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-634"><a href="#CategoricalClassification-634"><span class="linenos">634</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-635"><a href="#CategoricalClassification-635"><span class="linenos">635</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-636"><a href="#CategoricalClassification-636"><span class="linenos">636</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.2</span><span class="p">,</span>
+</span><span id="CategoricalClassification-637"><a href="#CategoricalClassification-637"><span class="linenos">637</span></a>        <span class="nb">type</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;categorical&#39;</span><span class="p">,</span> <span class="s1">&#39;missing&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;categorical&#39;</span><span class="p">,</span>
+</span><span id="CategoricalClassification-638"><a href="#CategoricalClassification-638"><span class="linenos">638</span></a>        <span class="n">missing_val</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;-inf&#39;</span><span class="p">),</span>
+</span><span id="CategoricalClassification-639"><a href="#CategoricalClassification-639"><span class="linenos">639</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification-640"><a href="#CategoricalClassification-640"><span class="linenos">640</span></a>
+</span><span id="CategoricalClassification-641"><a href="#CategoricalClassification-641"><span class="linenos">641</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-642"><a href="#CategoricalClassification-642"><span class="linenos">642</span></a><span class="sd">        Simulates noise on given dataset X</span>
+</span><span id="CategoricalClassification-643"><a href="#CategoricalClassification-643"><span class="linenos">643</span></a><span class="sd">        :param X: dataset to apply noise to</span>
+</span><span id="CategoricalClassification-644"><a href="#CategoricalClassification-644"><span class="linenos">644</span></a><span class="sd">        :param y: required target labels for categorical noise generation</span>
+</span><span id="CategoricalClassification-645"><a href="#CategoricalClassification-645"><span class="linenos">645</span></a><span class="sd">        :param p: amount of noise to apply. Defaults to 0.2</span>
+</span><span id="CategoricalClassification-646"><a href="#CategoricalClassification-646"><span class="linenos">646</span></a><span class="sd">        :param type: type of noise to apply, either categorical or missing</span>
+</span><span id="CategoricalClassification-647"><a href="#CategoricalClassification-647"><span class="linenos">647</span></a><span class="sd">        :param missing_val: value to simulate missing values. Defaults to float(&#39;-inf&#39;)</span>
+</span><span id="CategoricalClassification-648"><a href="#CategoricalClassification-648"><span class="linenos">648</span></a><span class="sd">        :return: X with noise applied</span>
+</span><span id="CategoricalClassification-649"><a href="#CategoricalClassification-649"><span class="linenos">649</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-650"><a href="#CategoricalClassification-650"><span class="linenos">650</span></a>
+</span><span id="CategoricalClassification-651"><a href="#CategoricalClassification-651"><span class="linenos">651</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="CategoricalClassification-652"><a href="#CategoricalClassification-652"><span class="linenos">652</span></a>            <span class="s1">&#39;type&#39;</span><span class="p">:</span> <span class="nb">type</span><span class="p">,</span>
+</span><span id="CategoricalClassification-653"><a href="#CategoricalClassification-653"><span class="linenos">653</span></a>            <span class="s1">&#39;amount&#39;</span><span class="p">:</span> <span class="n">p</span><span class="p">,</span>
+</span><span id="CategoricalClassification-654"><a href="#CategoricalClassification-654"><span class="linenos">654</span></a>        <span class="p">})</span>
 </span><span id="CategoricalClassification-655"><a href="#CategoricalClassification-655"><span class="linenos">655</span></a>
-</span><span id="CategoricalClassification-656"><a href="#CategoricalClassification-656"><span class="linenos">656</span></a>            <span class="n">Xs_T</span> <span class="o">=</span> <span class="n">X_sort</span><span class="o">.</span><span class="n">T</span>
-</span><span id="CategoricalClassification-657"><a href="#CategoricalClassification-657"><span class="linenos">657</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="CategoricalClassification-658"><a href="#CategoricalClassification-658"><span class="linenos">658</span></a>            <span class="n">n_flip</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
+</span><span id="CategoricalClassification-656"><a href="#CategoricalClassification-656"><span class="linenos">656</span></a>        <span class="k">if</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;categorical&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification-657"><a href="#CategoricalClassification-657"><span class="linenos">657</span></a>            <span class="n">label_values</span><span class="p">,</span> <span class="n">label_count</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="CategoricalClassification-658"><a href="#CategoricalClassification-658"><span class="linenos">658</span></a>            <span class="n">n_labels</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">label_values</span><span class="p">)</span>
 </span><span id="CategoricalClassification-659"><a href="#CategoricalClassification-659"><span class="linenos">659</span></a>
-</span><span id="CategoricalClassification-660"><a href="#CategoricalClassification-660"><span class="linenos">660</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xs_T</span><span class="p">:</span>
-</span><span id="CategoricalClassification-661"><a href="#CategoricalClassification-661"><span class="linenos">661</span></a>                <span class="n">unique_per_label</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="CategoricalClassification-662"><a href="#CategoricalClassification-662"><span class="linenos">662</span></a>
-</span><span id="CategoricalClassification-663"><a href="#CategoricalClassification-663"><span class="linenos">663</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_labels</span><span class="p">):</span>
-</span><span id="CategoricalClassification-664"><a href="#CategoricalClassification-664"><span class="linenos">664</span></a>                    <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="CategoricalClassification-665"><a href="#CategoricalClassification-665"><span class="linenos">665</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]])</span>
-</span><span id="CategoricalClassification-666"><a href="#CategoricalClassification-666"><span class="linenos">666</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
-</span><span id="CategoricalClassification-667"><a href="#CategoricalClassification-667"><span class="linenos">667</span></a>                    <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-668"><a href="#CategoricalClassification-668"><span class="linenos">668</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">-</span> <span class="mi">1</span><span class="p">])</span>
-</span><span id="CategoricalClassification-669"><a href="#CategoricalClassification-669"><span class="linenos">669</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
+</span><span id="CategoricalClassification-660"><a href="#CategoricalClassification-660"><span class="linenos">660</span></a>            <span class="n">inds</span> <span class="o">=</span> <span class="n">y</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
+</span><span id="CategoricalClassification-661"><a href="#CategoricalClassification-661"><span class="linenos">661</span></a>            <span class="n">y_sort</span> <span class="o">=</span> <span class="n">y</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
+</span><span id="CategoricalClassification-662"><a href="#CategoricalClassification-662"><span class="linenos">662</span></a>            <span class="n">X_sort</span> <span class="o">=</span> <span class="n">X</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
+</span><span id="CategoricalClassification-663"><a href="#CategoricalClassification-663"><span class="linenos">663</span></a>
+</span><span id="CategoricalClassification-664"><a href="#CategoricalClassification-664"><span class="linenos">664</span></a>            <span class="n">Xs_T</span> <span class="o">=</span> <span class="n">X_sort</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-665"><a href="#CategoricalClassification-665"><span class="linenos">665</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="CategoricalClassification-666"><a href="#CategoricalClassification-666"><span class="linenos">666</span></a>            <span class="n">n_flip</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
+</span><span id="CategoricalClassification-667"><a href="#CategoricalClassification-667"><span class="linenos">667</span></a>
+</span><span id="CategoricalClassification-668"><a href="#CategoricalClassification-668"><span class="linenos">668</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xs_T</span><span class="p">:</span>
+</span><span id="CategoricalClassification-669"><a href="#CategoricalClassification-669"><span class="linenos">669</span></a>                <span class="n">unique_per_label</span> <span class="o">=</span> <span class="p">{}</span>
 </span><span id="CategoricalClassification-670"><a href="#CategoricalClassification-670"><span class="linenos">670</span></a>
-</span><span id="CategoricalClassification-671"><a href="#CategoricalClassification-671"><span class="linenos">671</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_flip</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-</span><span id="CategoricalClassification-672"><a href="#CategoricalClassification-672"><span class="linenos">672</span></a>
-</span><span id="CategoricalClassification-673"><a href="#CategoricalClassification-673"><span class="linenos">673</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
-</span><span id="CategoricalClassification-674"><a href="#CategoricalClassification-674"><span class="linenos">674</span></a>                    <span class="n">current_label</span> <span class="o">=</span> <span class="n">y_sort</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span>
-</span><span id="CategoricalClassification-675"><a href="#CategoricalClassification-675"><span class="linenos">675</span></a>                    <span class="n">possible_labels</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">label_values</span> <span class="o">!=</span> <span class="n">current_label</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="CategoricalClassification-676"><a href="#CategoricalClassification-676"><span class="linenos">676</span></a>
-</span><span id="CategoricalClassification-677"><a href="#CategoricalClassification-677"><span class="linenos">677</span></a>                    <span class="c1"># find all unique values from labels != current label</span>
-</span><span id="CategoricalClassification-678"><a href="#CategoricalClassification-678"><span class="linenos">678</span></a>                    <span class="n">values</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span>
-</span><span id="CategoricalClassification-679"><a href="#CategoricalClassification-679"><span class="linenos">679</span></a>                    <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">possible_labels</span><span class="p">:</span>
-</span><span id="CategoricalClassification-680"><a href="#CategoricalClassification-680"><span class="linenos">680</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">values</span><span class="o">.</span><span class="n">union</span><span class="p">(</span><span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">])</span>
-</span><span id="CategoricalClassification-681"><a href="#CategoricalClassification-681"><span class="linenos">681</span></a>
-</span><span id="CategoricalClassification-682"><a href="#CategoricalClassification-682"><span class="linenos">682</span></a>                    <span class="c1"># remove any overlapping values, ensuring replacement values are unique &amp; from a target label !=</span>
-</span><span id="CategoricalClassification-683"><a href="#CategoricalClassification-683"><span class="linenos">683</span></a>                    <span class="c1"># current label</span>
-</span><span id="CategoricalClassification-684"><a href="#CategoricalClassification-684"><span class="linenos">684</span></a>                    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">current_label</span><span class="p">]</span> <span class="o">&amp;</span> <span class="n">values</span><span class="p">:</span>
-</span><span id="CategoricalClassification-685"><a href="#CategoricalClassification-685"><span class="linenos">685</span></a>                        <span class="n">values</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">val</span><span class="p">)</span>
-</span><span id="CategoricalClassification-686"><a href="#CategoricalClassification-686"><span class="linenos">686</span></a>
-</span><span id="CategoricalClassification-687"><a href="#CategoricalClassification-687"><span class="linenos">687</span></a>                    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">values</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="CategoricalClassification-688"><a href="#CategoricalClassification-688"><span class="linenos">688</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
+</span><span id="CategoricalClassification-671"><a href="#CategoricalClassification-671"><span class="linenos">671</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_labels</span><span class="p">):</span>
+</span><span id="CategoricalClassification-672"><a href="#CategoricalClassification-672"><span class="linenos">672</span></a>                    <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification-673"><a href="#CategoricalClassification-673"><span class="linenos">673</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]])</span>
+</span><span id="CategoricalClassification-674"><a href="#CategoricalClassification-674"><span class="linenos">674</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
+</span><span id="CategoricalClassification-675"><a href="#CategoricalClassification-675"><span class="linenos">675</span></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-676"><a href="#CategoricalClassification-676"><span class="linenos">676</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">-</span> <span class="mi">1</span><span class="p">])</span>
+</span><span id="CategoricalClassification-677"><a href="#CategoricalClassification-677"><span class="linenos">677</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
+</span><span id="CategoricalClassification-678"><a href="#CategoricalClassification-678"><span class="linenos">678</span></a>
+</span><span id="CategoricalClassification-679"><a href="#CategoricalClassification-679"><span class="linenos">679</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_flip</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="CategoricalClassification-680"><a href="#CategoricalClassification-680"><span class="linenos">680</span></a>
+</span><span id="CategoricalClassification-681"><a href="#CategoricalClassification-681"><span class="linenos">681</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
+</span><span id="CategoricalClassification-682"><a href="#CategoricalClassification-682"><span class="linenos">682</span></a>                    <span class="n">current_label</span> <span class="o">=</span> <span class="n">y_sort</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span>
+</span><span id="CategoricalClassification-683"><a href="#CategoricalClassification-683"><span class="linenos">683</span></a>                    <span class="n">possible_labels</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">label_values</span> <span class="o">!=</span> <span class="n">current_label</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="CategoricalClassification-684"><a href="#CategoricalClassification-684"><span class="linenos">684</span></a>
+</span><span id="CategoricalClassification-685"><a href="#CategoricalClassification-685"><span class="linenos">685</span></a>                    <span class="c1"># find all unique values from labels != current label</span>
+</span><span id="CategoricalClassification-686"><a href="#CategoricalClassification-686"><span class="linenos">686</span></a>                    <span class="n">values</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span>
+</span><span id="CategoricalClassification-687"><a href="#CategoricalClassification-687"><span class="linenos">687</span></a>                    <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">possible_labels</span><span class="p">:</span>
+</span><span id="CategoricalClassification-688"><a href="#CategoricalClassification-688"><span class="linenos">688</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">values</span><span class="o">.</span><span class="n">union</span><span class="p">(</span><span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">])</span>
 </span><span id="CategoricalClassification-689"><a href="#CategoricalClassification-689"><span class="linenos">689</span></a>
-</span><span id="CategoricalClassification-690"><a href="#CategoricalClassification-690"><span class="linenos">690</span></a>                    <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-691"><a href="#CategoricalClassification-691"><span class="linenos">691</span></a>                        <span class="n">key</span> <span class="o">=</span> <span class="n">possible_labels</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">possible_labels</span><span class="p">))]</span>
-</span><span id="CategoricalClassification-692"><a href="#CategoricalClassification-692"><span class="linenos">692</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
-</span><span id="CategoricalClassification-693"><a href="#CategoricalClassification-693"><span class="linenos">693</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
+</span><span id="CategoricalClassification-690"><a href="#CategoricalClassification-690"><span class="linenos">690</span></a>                    <span class="c1"># remove any overlapping values, ensuring replacement values are unique &amp; from a target label !=</span>
+</span><span id="CategoricalClassification-691"><a href="#CategoricalClassification-691"><span class="linenos">691</span></a>                    <span class="c1"># current label</span>
+</span><span id="CategoricalClassification-692"><a href="#CategoricalClassification-692"><span class="linenos">692</span></a>                    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">current_label</span><span class="p">]</span> <span class="o">&amp;</span> <span class="n">values</span><span class="p">:</span>
+</span><span id="CategoricalClassification-693"><a href="#CategoricalClassification-693"><span class="linenos">693</span></a>                        <span class="n">values</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">val</span><span class="p">)</span>
 </span><span id="CategoricalClassification-694"><a href="#CategoricalClassification-694"><span class="linenos">694</span></a>
-</span><span id="CategoricalClassification-695"><a href="#CategoricalClassification-695"><span class="linenos">695</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">val</span>
-</span><span id="CategoricalClassification-696"><a href="#CategoricalClassification-696"><span class="linenos">696</span></a>
-</span><span id="CategoricalClassification-697"><a href="#CategoricalClassification-697"><span class="linenos">697</span></a>            <span class="n">rev_ind</span> <span class="o">=</span> <span class="n">inds</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
-</span><span id="CategoricalClassification-698"><a href="#CategoricalClassification-698"><span class="linenos">698</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">T</span>
-</span><span id="CategoricalClassification-699"><a href="#CategoricalClassification-699"><span class="linenos">699</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">X_noise</span><span class="p">[</span><span class="n">rev_ind</span><span class="p">]</span>
-</span><span id="CategoricalClassification-700"><a href="#CategoricalClassification-700"><span class="linenos">700</span></a>
-</span><span id="CategoricalClassification-701"><a href="#CategoricalClassification-701"><span class="linenos">701</span></a>            <span class="k">return</span> <span class="n">X_noise</span>
+</span><span id="CategoricalClassification-695"><a href="#CategoricalClassification-695"><span class="linenos">695</span></a>                    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">values</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification-696"><a href="#CategoricalClassification-696"><span class="linenos">696</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
+</span><span id="CategoricalClassification-697"><a href="#CategoricalClassification-697"><span class="linenos">697</span></a>
+</span><span id="CategoricalClassification-698"><a href="#CategoricalClassification-698"><span class="linenos">698</span></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-699"><a href="#CategoricalClassification-699"><span class="linenos">699</span></a>                        <span class="n">key</span> <span class="o">=</span> <span class="n">possible_labels</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">possible_labels</span><span class="p">))]</span>
+</span><span id="CategoricalClassification-700"><a href="#CategoricalClassification-700"><span class="linenos">700</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
+</span><span id="CategoricalClassification-701"><a href="#CategoricalClassification-701"><span class="linenos">701</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
 </span><span id="CategoricalClassification-702"><a href="#CategoricalClassification-702"><span class="linenos">702</span></a>
-</span><span id="CategoricalClassification-703"><a href="#CategoricalClassification-703"><span class="linenos">703</span></a>        <span class="k">elif</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;missing&#39;</span><span class="p">:</span>
-</span><span id="CategoricalClassification-704"><a href="#CategoricalClassification-704"><span class="linenos">704</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-</span><span id="CategoricalClassification-705"><a href="#CategoricalClassification-705"><span class="linenos">705</span></a>            <span class="n">Xn_T</span> <span class="o">=</span> <span class="n">X_noise</span><span class="o">.</span><span class="n">T</span>
-</span><span id="CategoricalClassification-706"><a href="#CategoricalClassification-706"><span class="linenos">706</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="CategoricalClassification-707"><a href="#CategoricalClassification-707"><span class="linenos">707</span></a>            <span class="n">n_missing</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
-</span><span id="CategoricalClassification-708"><a href="#CategoricalClassification-708"><span class="linenos">708</span></a>            <span class="c1">#print(&quot;n to delete:&quot;, n_missing)</span>
-</span><span id="CategoricalClassification-709"><a href="#CategoricalClassification-709"><span class="linenos">709</span></a>
-</span><span id="CategoricalClassification-710"><a href="#CategoricalClassification-710"><span class="linenos">710</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xn_T</span><span class="p">:</span>
-</span><span id="CategoricalClassification-711"><a href="#CategoricalClassification-711"><span class="linenos">711</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_missing</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-</span><span id="CategoricalClassification-712"><a href="#CategoricalClassification-712"><span class="linenos">712</span></a>
-</span><span id="CategoricalClassification-713"><a href="#CategoricalClassification-713"><span class="linenos">713</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
-</span><span id="CategoricalClassification-714"><a href="#CategoricalClassification-714"><span class="linenos">714</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">missing_val</span>
-</span><span id="CategoricalClassification-715"><a href="#CategoricalClassification-715"><span class="linenos">715</span></a>
-</span><span id="CategoricalClassification-716"><a href="#CategoricalClassification-716"><span class="linenos">716</span></a>            <span class="k">return</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-703"><a href="#CategoricalClassification-703"><span class="linenos">703</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">val</span>
+</span><span id="CategoricalClassification-704"><a href="#CategoricalClassification-704"><span class="linenos">704</span></a>
+</span><span id="CategoricalClassification-705"><a href="#CategoricalClassification-705"><span class="linenos">705</span></a>            <span class="n">rev_ind</span> <span class="o">=</span> <span class="n">inds</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
+</span><span id="CategoricalClassification-706"><a href="#CategoricalClassification-706"><span class="linenos">706</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-707"><a href="#CategoricalClassification-707"><span class="linenos">707</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">X_noise</span><span class="p">[</span><span class="n">rev_ind</span><span class="p">]</span>
+</span><span id="CategoricalClassification-708"><a href="#CategoricalClassification-708"><span class="linenos">708</span></a>
+</span><span id="CategoricalClassification-709"><a href="#CategoricalClassification-709"><span class="linenos">709</span></a>            <span class="k">return</span> <span class="n">X_noise</span>
+</span><span id="CategoricalClassification-710"><a href="#CategoricalClassification-710"><span class="linenos">710</span></a>
+</span><span id="CategoricalClassification-711"><a href="#CategoricalClassification-711"><span class="linenos">711</span></a>        <span class="k">elif</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;missing&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification-712"><a href="#CategoricalClassification-712"><span class="linenos">712</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification-713"><a href="#CategoricalClassification-713"><span class="linenos">713</span></a>            <span class="n">Xn_T</span> <span class="o">=</span> <span class="n">X_noise</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-714"><a href="#CategoricalClassification-714"><span class="linenos">714</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="CategoricalClassification-715"><a href="#CategoricalClassification-715"><span class="linenos">715</span></a>            <span class="n">n_missing</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
+</span><span id="CategoricalClassification-716"><a href="#CategoricalClassification-716"><span class="linenos">716</span></a>            <span class="c1">#print(&quot;n to delete:&quot;, n_missing)</span>
 </span><span id="CategoricalClassification-717"><a href="#CategoricalClassification-717"><span class="linenos">717</span></a>
-</span><span id="CategoricalClassification-718"><a href="#CategoricalClassification-718"><span class="linenos">718</span></a>    <span class="k">def</span> <span class="nf">downsample_dataset</span><span class="p">(</span>
-</span><span id="CategoricalClassification-719"><a href="#CategoricalClassification-719"><span class="linenos">719</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification-720"><a href="#CategoricalClassification-720"><span class="linenos">720</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification-721"><a href="#CategoricalClassification-721"><span class="linenos">721</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification-722"><a href="#CategoricalClassification-722"><span class="linenos">722</span></a>        <span class="n">N</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="CategoricalClassification-723"><a href="#CategoricalClassification-723"><span class="linenos">723</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
-</span><span id="CategoricalClassification-724"><a href="#CategoricalClassification-724"><span class="linenos">724</span></a>        <span class="n">reshuffle</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="CategoricalClassification-725"><a href="#CategoricalClassification-725"><span class="linenos">725</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">]:</span>
-</span><span id="CategoricalClassification-726"><a href="#CategoricalClassification-726"><span class="linenos">726</span></a>
-</span><span id="CategoricalClassification-727"><a href="#CategoricalClassification-727"><span class="linenos">727</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-728"><a href="#CategoricalClassification-728"><span class="linenos">728</span></a><span class="sd">        Downsamples dataset X according to N or the number of samples in minority class, resulting in a balanced dataset.</span>
-</span><span id="CategoricalClassification-729"><a href="#CategoricalClassification-729"><span class="linenos">729</span></a><span class="sd">        :param X: Dataset to downsample</span>
-</span><span id="CategoricalClassification-730"><a href="#CategoricalClassification-730"><span class="linenos">730</span></a><span class="sd">        :param y: Labels corresponding to X</span>
-</span><span id="CategoricalClassification-731"><a href="#CategoricalClassification-731"><span class="linenos">731</span></a><span class="sd">        :param N: Optional number of samples per class to downsample to</span>
-</span><span id="CategoricalClassification-732"><a href="#CategoricalClassification-732"><span class="linenos">732</span></a><span class="sd">        :param seed: Seed for random state of resample function</span>
-</span><span id="CategoricalClassification-733"><a href="#CategoricalClassification-733"><span class="linenos">733</span></a><span class="sd">        :param reshuffle: Reshuffle the dataset after downsampling</span>
-</span><span id="CategoricalClassification-734"><a href="#CategoricalClassification-734"><span class="linenos">734</span></a><span class="sd">        :return: Balanced X and y after downsampling</span>
-</span><span id="CategoricalClassification-735"><a href="#CategoricalClassification-735"><span class="linenos">735</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-736"><a href="#CategoricalClassification-736"><span class="linenos">736</span></a>
-</span><span id="CategoricalClassification-737"><a href="#CategoricalClassification-737"><span class="linenos">737</span></a>        <span class="n">original_shape</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="CategoricalClassification-738"><a href="#CategoricalClassification-738"><span class="linenos">738</span></a>
-</span><span id="CategoricalClassification-739"><a href="#CategoricalClassification-739"><span class="linenos">739</span></a>        <span class="n">values</span><span class="p">,</span> <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="CategoricalClassification-740"><a href="#CategoricalClassification-740"><span class="linenos">740</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="CategoricalClassification-741"><a href="#CategoricalClassification-741"><span class="linenos">741</span></a>            <span class="n">N</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">)</span>
-</span><span id="CategoricalClassification-742"><a href="#CategoricalClassification-742"><span class="linenos">742</span></a>
-</span><span id="CategoricalClassification-743"><a href="#CategoricalClassification-743"><span class="linenos">743</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="o">&gt;</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">):</span>
-</span><span id="CategoricalClassification-744"><a href="#CategoricalClassification-744"><span class="linenos">744</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;N must be equal to or less than the number of samples in minority class&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-745"><a href="#CategoricalClassification-745"><span class="linenos">745</span></a>
-</span><span id="CategoricalClassification-746"><a href="#CategoricalClassification-746"><span class="linenos">746</span></a>        <span class="n">X_arrays_list</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="CategoricalClassification-747"><a href="#CategoricalClassification-747"><span class="linenos">747</span></a>        <span class="n">y_downsampled</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="CategoricalClassification-748"><a href="#CategoricalClassification-748"><span class="linenos">748</span></a>        <span class="k">for</span> <span class="n">label</span> <span class="ow">in</span> <span class="n">values</span><span class="p">:</span>
-</span><span id="CategoricalClassification-749"><a href="#CategoricalClassification-749"><span class="linenos">749</span></a>            <span class="n">X_label</span> <span class="o">=</span> <span class="p">[</span><span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">y</span><span class="p">))</span> <span class="k">if</span> <span class="n">y</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">==</span> <span class="n">label</span><span class="p">]</span>
-</span><span id="CategoricalClassification-750"><a href="#CategoricalClassification-750"><span class="linenos">750</span></a>            <span class="n">X_label_downsample</span> <span class="o">=</span> <span class="n">resample</span><span class="p">(</span>
-</span><span id="CategoricalClassification-751"><a href="#CategoricalClassification-751"><span class="linenos">751</span></a>                <span class="n">X_label</span><span class="p">,</span>
-</span><span id="CategoricalClassification-752"><a href="#CategoricalClassification-752"><span class="linenos">752</span></a>                <span class="n">replace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-</span><span id="CategoricalClassification-753"><a href="#CategoricalClassification-753"><span class="linenos">753</span></a>                <span class="n">n_samples</span><span class="o">=</span><span class="n">N</span><span class="p">,</span>
-</span><span id="CategoricalClassification-754"><a href="#CategoricalClassification-754"><span class="linenos">754</span></a>                <span class="n">random_state</span><span class="o">=</span><span class="n">seed</span><span class="p">,</span>
-</span><span id="CategoricalClassification-755"><a href="#CategoricalClassification-755"><span class="linenos">755</span></a>            <span class="p">)</span>
-</span><span id="CategoricalClassification-756"><a href="#CategoricalClassification-756"><span class="linenos">756</span></a>            <span class="n">X_arrays_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">X_label_downsample</span><span class="p">)</span>
-</span><span id="CategoricalClassification-757"><a href="#CategoricalClassification-757"><span class="linenos">757</span></a>            <span class="n">ys</span> <span class="o">=</span> <span class="p">[</span><span class="n">label</span><span class="p">]</span> <span class="o">*</span> <span class="n">N</span>
-</span><span id="CategoricalClassification-758"><a href="#CategoricalClassification-758"><span class="linenos">758</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">y_downsampled</span><span class="p">,</span> <span class="n">ys</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="CategoricalClassification-759"><a href="#CategoricalClassification-759"><span class="linenos">759</span></a>
-</span><span id="CategoricalClassification-760"><a href="#CategoricalClassification-760"><span class="linenos">760</span></a>        <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">X_arrays_list</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="CategoricalClassification-761"><a href="#CategoricalClassification-761"><span class="linenos">761</span></a>
-</span><span id="CategoricalClassification-762"><a href="#CategoricalClassification-762"><span class="linenos">762</span></a>        <span class="k">if</span> <span class="n">reshuffle</span><span class="p">:</span>
-</span><span id="CategoricalClassification-763"><a href="#CategoricalClassification-763"><span class="linenos">763</span></a>            <span class="n">indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X_downsampled</span><span class="p">))</span>
-</span><span id="CategoricalClassification-764"><a href="#CategoricalClassification-764"><span class="linenos">764</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">indices</span><span class="p">)</span>
-</span><span id="CategoricalClassification-765"><a href="#CategoricalClassification-765"><span class="linenos">765</span></a>            <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
-</span><span id="CategoricalClassification-766"><a href="#CategoricalClassification-766"><span class="linenos">766</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">y_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
-</span><span id="CategoricalClassification-767"><a href="#CategoricalClassification-767"><span class="linenos">767</span></a>
-</span><span id="CategoricalClassification-768"><a href="#CategoricalClassification-768"><span class="linenos">768</span></a>        <span class="n">downsampled_shape</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="CategoricalClassification-769"><a href="#CategoricalClassification-769"><span class="linenos">769</span></a>
-</span><span id="CategoricalClassification-770"><a href="#CategoricalClassification-770"><span class="linenos">770</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
-</span><span id="CategoricalClassification-771"><a href="#CategoricalClassification-771"><span class="linenos">771</span></a>            <span class="s1">&#39;downsampling&#39;</span><span class="p">:</span> <span class="p">{</span>
-</span><span id="CategoricalClassification-772"><a href="#CategoricalClassification-772"><span class="linenos">772</span></a>                <span class="s1">&#39;original_shape&#39;</span><span class="p">:</span> <span class="n">original_shape</span><span class="p">,</span>
-</span><span id="CategoricalClassification-773"><a href="#CategoricalClassification-773"><span class="linenos">773</span></a>                <span class="s1">&#39;downsampled_shape&#39;</span><span class="p">:</span> <span class="n">downsampled_shape</span><span class="p">,</span>
-</span><span id="CategoricalClassification-774"><a href="#CategoricalClassification-774"><span class="linenos">774</span></a>            <span class="p">},</span>
-</span><span id="CategoricalClassification-775"><a href="#CategoricalClassification-775"><span class="linenos">775</span></a>        <span class="p">})</span>
-</span><span id="CategoricalClassification-776"><a href="#CategoricalClassification-776"><span class="linenos">776</span></a>
-</span><span id="CategoricalClassification-777"><a href="#CategoricalClassification-777"><span class="linenos">777</span></a>        <span class="k">return</span> <span class="n">X_downsampled</span><span class="p">,</span> <span class="n">y_downsampled</span>
+</span><span id="CategoricalClassification-718"><a href="#CategoricalClassification-718"><span class="linenos">718</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xn_T</span><span class="p">:</span>
+</span><span id="CategoricalClassification-719"><a href="#CategoricalClassification-719"><span class="linenos">719</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_missing</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="CategoricalClassification-720"><a href="#CategoricalClassification-720"><span class="linenos">720</span></a>
+</span><span id="CategoricalClassification-721"><a href="#CategoricalClassification-721"><span class="linenos">721</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
+</span><span id="CategoricalClassification-722"><a href="#CategoricalClassification-722"><span class="linenos">722</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">missing_val</span>
+</span><span id="CategoricalClassification-723"><a href="#CategoricalClassification-723"><span class="linenos">723</span></a>
+</span><span id="CategoricalClassification-724"><a href="#CategoricalClassification-724"><span class="linenos">724</span></a>            <span class="k">return</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification-725"><a href="#CategoricalClassification-725"><span class="linenos">725</span></a>
+</span><span id="CategoricalClassification-726"><a href="#CategoricalClassification-726"><span class="linenos">726</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-727"><a href="#CategoricalClassification-727"><span class="linenos">727</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Type </span><span class="si">{</span><span class="nb">type</span><span class="si">}</span><span class="s1"> not supported&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-728"><a href="#CategoricalClassification-728"><span class="linenos">728</span></a>
+</span><span id="CategoricalClassification-729"><a href="#CategoricalClassification-729"><span class="linenos">729</span></a>    <span class="k">def</span> <span class="nf">downsample_dataset</span><span class="p">(</span>
+</span><span id="CategoricalClassification-730"><a href="#CategoricalClassification-730"><span class="linenos">730</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-731"><a href="#CategoricalClassification-731"><span class="linenos">731</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-732"><a href="#CategoricalClassification-732"><span class="linenos">732</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-733"><a href="#CategoricalClassification-733"><span class="linenos">733</span></a>        <span class="n">N</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification-734"><a href="#CategoricalClassification-734"><span class="linenos">734</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
+</span><span id="CategoricalClassification-735"><a href="#CategoricalClassification-735"><span class="linenos">735</span></a>        <span class="n">reshuffle</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification-736"><a href="#CategoricalClassification-736"><span class="linenos">736</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">]:</span>
+</span><span id="CategoricalClassification-737"><a href="#CategoricalClassification-737"><span class="linenos">737</span></a>
+</span><span id="CategoricalClassification-738"><a href="#CategoricalClassification-738"><span class="linenos">738</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-739"><a href="#CategoricalClassification-739"><span class="linenos">739</span></a><span class="sd">        Downsamples dataset X according to N or the number of samples in minority class, resulting in a balanced dataset.</span>
+</span><span id="CategoricalClassification-740"><a href="#CategoricalClassification-740"><span class="linenos">740</span></a><span class="sd">        :param X: Dataset to downsample</span>
+</span><span id="CategoricalClassification-741"><a href="#CategoricalClassification-741"><span class="linenos">741</span></a><span class="sd">        :param y: Labels corresponding to X</span>
+</span><span id="CategoricalClassification-742"><a href="#CategoricalClassification-742"><span class="linenos">742</span></a><span class="sd">        :param N: Optional number of samples per class to downsample to</span>
+</span><span id="CategoricalClassification-743"><a href="#CategoricalClassification-743"><span class="linenos">743</span></a><span class="sd">        :param seed: Seed for random state of resample function</span>
+</span><span id="CategoricalClassification-744"><a href="#CategoricalClassification-744"><span class="linenos">744</span></a><span class="sd">        :param reshuffle: Reshuffle the dataset after downsampling</span>
+</span><span id="CategoricalClassification-745"><a href="#CategoricalClassification-745"><span class="linenos">745</span></a><span class="sd">        :return: Balanced X and y after downsampling</span>
+</span><span id="CategoricalClassification-746"><a href="#CategoricalClassification-746"><span class="linenos">746</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-747"><a href="#CategoricalClassification-747"><span class="linenos">747</span></a>
+</span><span id="CategoricalClassification-748"><a href="#CategoricalClassification-748"><span class="linenos">748</span></a>        <span class="n">original_shape</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification-749"><a href="#CategoricalClassification-749"><span class="linenos">749</span></a>
+</span><span id="CategoricalClassification-750"><a href="#CategoricalClassification-750"><span class="linenos">750</span></a>        <span class="n">values</span><span class="p">,</span> <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="CategoricalClassification-751"><a href="#CategoricalClassification-751"><span class="linenos">751</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification-752"><a href="#CategoricalClassification-752"><span class="linenos">752</span></a>            <span class="n">N</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">)</span>
+</span><span id="CategoricalClassification-753"><a href="#CategoricalClassification-753"><span class="linenos">753</span></a>
+</span><span id="CategoricalClassification-754"><a href="#CategoricalClassification-754"><span class="linenos">754</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="o">&gt;</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">):</span>
+</span><span id="CategoricalClassification-755"><a href="#CategoricalClassification-755"><span class="linenos">755</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;N must be equal to or less than the number of samples in minority class&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-756"><a href="#CategoricalClassification-756"><span class="linenos">756</span></a>
+</span><span id="CategoricalClassification-757"><a href="#CategoricalClassification-757"><span class="linenos">757</span></a>        <span class="n">X_arrays_list</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification-758"><a href="#CategoricalClassification-758"><span class="linenos">758</span></a>        <span class="n">y_downsampled</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification-759"><a href="#CategoricalClassification-759"><span class="linenos">759</span></a>        <span class="k">for</span> <span class="n">label</span> <span class="ow">in</span> <span class="n">values</span><span class="p">:</span>
+</span><span id="CategoricalClassification-760"><a href="#CategoricalClassification-760"><span class="linenos">760</span></a>            <span class="n">X_label</span> <span class="o">=</span> <span class="p">[</span><span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">y</span><span class="p">))</span> <span class="k">if</span> <span class="n">y</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">==</span> <span class="n">label</span><span class="p">]</span>
+</span><span id="CategoricalClassification-761"><a href="#CategoricalClassification-761"><span class="linenos">761</span></a>            <span class="n">X_label_downsample</span> <span class="o">=</span> <span class="n">resample</span><span class="p">(</span>
+</span><span id="CategoricalClassification-762"><a href="#CategoricalClassification-762"><span class="linenos">762</span></a>                <span class="n">X_label</span><span class="p">,</span>
+</span><span id="CategoricalClassification-763"><a href="#CategoricalClassification-763"><span class="linenos">763</span></a>                <span class="n">replace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+</span><span id="CategoricalClassification-764"><a href="#CategoricalClassification-764"><span class="linenos">764</span></a>                <span class="n">n_samples</span><span class="o">=</span><span class="n">N</span><span class="p">,</span>
+</span><span id="CategoricalClassification-765"><a href="#CategoricalClassification-765"><span class="linenos">765</span></a>                <span class="n">random_state</span><span class="o">=</span><span class="n">seed</span><span class="p">,</span>
+</span><span id="CategoricalClassification-766"><a href="#CategoricalClassification-766"><span class="linenos">766</span></a>            <span class="p">)</span>
+</span><span id="CategoricalClassification-767"><a href="#CategoricalClassification-767"><span class="linenos">767</span></a>            <span class="n">X_arrays_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">X_label_downsample</span><span class="p">)</span>
+</span><span id="CategoricalClassification-768"><a href="#CategoricalClassification-768"><span class="linenos">768</span></a>            <span class="n">ys</span> <span class="o">=</span> <span class="p">[</span><span class="n">label</span><span class="p">]</span> <span class="o">*</span> <span class="n">N</span>
+</span><span id="CategoricalClassification-769"><a href="#CategoricalClassification-769"><span class="linenos">769</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">y_downsampled</span><span class="p">,</span> <span class="n">ys</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification-770"><a href="#CategoricalClassification-770"><span class="linenos">770</span></a>
+</span><span id="CategoricalClassification-771"><a href="#CategoricalClassification-771"><span class="linenos">771</span></a>        <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">X_arrays_list</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification-772"><a href="#CategoricalClassification-772"><span class="linenos">772</span></a>
+</span><span id="CategoricalClassification-773"><a href="#CategoricalClassification-773"><span class="linenos">773</span></a>        <span class="k">if</span> <span class="n">reshuffle</span><span class="p">:</span>
+</span><span id="CategoricalClassification-774"><a href="#CategoricalClassification-774"><span class="linenos">774</span></a>            <span class="n">indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X_downsampled</span><span class="p">))</span>
+</span><span id="CategoricalClassification-775"><a href="#CategoricalClassification-775"><span class="linenos">775</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">indices</span><span class="p">)</span>
+</span><span id="CategoricalClassification-776"><a href="#CategoricalClassification-776"><span class="linenos">776</span></a>            <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification-777"><a href="#CategoricalClassification-777"><span class="linenos">777</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">y_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
 </span><span id="CategoricalClassification-778"><a href="#CategoricalClassification-778"><span class="linenos">778</span></a>
-</span><span id="CategoricalClassification-779"><a href="#CategoricalClassification-779"><span class="linenos">779</span></a>    <span class="k">def</span> <span class="nf">print_dataset</span><span class="p">(</span>
-</span><span id="CategoricalClassification-780"><a href="#CategoricalClassification-780"><span class="linenos">780</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification-781"><a href="#CategoricalClassification-781"><span class="linenos">781</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification-782"><a href="#CategoricalClassification-782"><span class="linenos">782</span></a>        <span class="n">y</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification-783"><a href="#CategoricalClassification-783"><span class="linenos">783</span></a>    <span class="p">):</span>
-</span><span id="CategoricalClassification-784"><a href="#CategoricalClassification-784"><span class="linenos">784</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-785"><a href="#CategoricalClassification-785"><span class="linenos">785</span></a><span class="sd">        Prints given dataset</span>
-</span><span id="CategoricalClassification-786"><a href="#CategoricalClassification-786"><span class="linenos">786</span></a><span class="sd">        :param X: dataset</span>
-</span><span id="CategoricalClassification-787"><a href="#CategoricalClassification-787"><span class="linenos">787</span></a><span class="sd">        :param y: labels</span>
-</span><span id="CategoricalClassification-788"><a href="#CategoricalClassification-788"><span class="linenos">788</span></a><span class="sd">        :return:</span>
-</span><span id="CategoricalClassification-789"><a href="#CategoricalClassification-789"><span class="linenos">789</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification-790"><a href="#CategoricalClassification-790"><span class="linenos">790</span></a>
-</span><span id="CategoricalClassification-791"><a href="#CategoricalClassification-791"><span class="linenos">791</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="CategoricalClassification-792"><a href="#CategoricalClassification-792"><span class="linenos">792</span></a>        <span class="n">n</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="CategoricalClassification-793"><a href="#CategoricalClassification-793"><span class="linenos">793</span></a>        <span class="k">for</span> <span class="n">arr</span> <span class="ow">in</span> <span class="n">X</span><span class="p">:</span>
-</span><span id="CategoricalClassification-794"><a href="#CategoricalClassification-794"><span class="linenos">794</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;[&#39;</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-795"><a href="#CategoricalClassification-795"><span class="linenos">795</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
-</span><span id="CategoricalClassification-796"><a href="#CategoricalClassification-796"><span class="linenos">796</span></a>                <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="n">n_features</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="CategoricalClassification-797"><a href="#CategoricalClassification-797"><span class="linenos">797</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-798"><a href="#CategoricalClassification-798"><span class="linenos">798</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification-799"><a href="#CategoricalClassification-799"><span class="linenos">799</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;, &#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-800"><a href="#CategoricalClassification-800"><span class="linenos">800</span></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;], Label: </span><span class="si">{</span><span class="n">y</span><span class="p">[</span><span class="n">n</span><span class="p">]</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-801"><a href="#CategoricalClassification-801"><span class="linenos">801</span></a>            <span class="n">n</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="CategoricalClassification-802"><a href="#CategoricalClassification-802"><span class="linenos">802</span></a>
-</span><span id="CategoricalClassification-803"><a href="#CategoricalClassification-803"><span class="linenos">803</span></a>    <span class="k">def</span> <span class="nf">summarize</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-</span><span id="CategoricalClassification-804"><a href="#CategoricalClassification-804"><span class="linenos">804</span></a>
-</span><span id="CategoricalClassification-805"><a href="#CategoricalClassification-805"><span class="linenos">805</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of features: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;general&#39;</span><span class="p">][</span><span class="s1">&#39;n_features&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-806"><a href="#CategoricalClassification-806"><span class="linenos">806</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of generated samples: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;general&#39;</span><span class="p">][</span><span class="s1">&#39;n_samples&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-807"><a href="#CategoricalClassification-807"><span class="linenos">807</span></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">]:</span>
-</span><span id="CategoricalClassification-808"><a href="#CategoricalClassification-808"><span class="linenos">808</span></a>            <span class="nb">print</span><span class="p">(</span>
-</span><span id="CategoricalClassification-809"><a href="#CategoricalClassification-809"><span class="linenos">809</span></a>                <span class="sa">f</span><span class="s2">&quot;Dataset downsampled from shape </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">][</span><span class="s1">&#39;original_shape&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">, to shape </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">][</span><span class="s1">&#39;downsampled_shape&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="CategoricalClassification-810"><a href="#CategoricalClassification-810"><span class="linenos">810</span></a>            <span class="p">)</span>
-</span><span id="CategoricalClassification-811"><a href="#CategoricalClassification-811"><span class="linenos">811</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of classes: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;labels&#39;</span><span class="p">][</span><span class="s1">&#39;n_class&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-812"><a href="#CategoricalClassification-812"><span class="linenos">812</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Class relation: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;labels&#39;</span><span class="p">][</span><span class="s1">&#39;class_relation&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-779"><a href="#CategoricalClassification-779"><span class="linenos">779</span></a>        <span class="n">downsampled_shape</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification-780"><a href="#CategoricalClassification-780"><span class="linenos">780</span></a>
+</span><span id="CategoricalClassification-781"><a href="#CategoricalClassification-781"><span class="linenos">781</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="CategoricalClassification-782"><a href="#CategoricalClassification-782"><span class="linenos">782</span></a>            <span class="s1">&#39;downsampling&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="CategoricalClassification-783"><a href="#CategoricalClassification-783"><span class="linenos">783</span></a>                <span class="s1">&#39;original_shape&#39;</span><span class="p">:</span> <span class="n">original_shape</span><span class="p">,</span>
+</span><span id="CategoricalClassification-784"><a href="#CategoricalClassification-784"><span class="linenos">784</span></a>                <span class="s1">&#39;downsampled_shape&#39;</span><span class="p">:</span> <span class="n">downsampled_shape</span><span class="p">,</span>
+</span><span id="CategoricalClassification-785"><a href="#CategoricalClassification-785"><span class="linenos">785</span></a>            <span class="p">},</span>
+</span><span id="CategoricalClassification-786"><a href="#CategoricalClassification-786"><span class="linenos">786</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification-787"><a href="#CategoricalClassification-787"><span class="linenos">787</span></a>
+</span><span id="CategoricalClassification-788"><a href="#CategoricalClassification-788"><span class="linenos">788</span></a>        <span class="k">return</span> <span class="n">X_downsampled</span><span class="p">,</span> <span class="n">y_downsampled</span>
+</span><span id="CategoricalClassification-789"><a href="#CategoricalClassification-789"><span class="linenos">789</span></a>
+</span><span id="CategoricalClassification-790"><a href="#CategoricalClassification-790"><span class="linenos">790</span></a>    <span class="k">def</span> <span class="nf">print_dataset</span><span class="p">(</span>
+</span><span id="CategoricalClassification-791"><a href="#CategoricalClassification-791"><span class="linenos">791</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification-792"><a href="#CategoricalClassification-792"><span class="linenos">792</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-793"><a href="#CategoricalClassification-793"><span class="linenos">793</span></a>        <span class="n">y</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification-794"><a href="#CategoricalClassification-794"><span class="linenos">794</span></a>    <span class="p">):</span>
+</span><span id="CategoricalClassification-795"><a href="#CategoricalClassification-795"><span class="linenos">795</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-796"><a href="#CategoricalClassification-796"><span class="linenos">796</span></a><span class="sd">        Prints given dataset</span>
+</span><span id="CategoricalClassification-797"><a href="#CategoricalClassification-797"><span class="linenos">797</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification-798"><a href="#CategoricalClassification-798"><span class="linenos">798</span></a><span class="sd">        :param y: labels</span>
+</span><span id="CategoricalClassification-799"><a href="#CategoricalClassification-799"><span class="linenos">799</span></a><span class="sd">        :return:</span>
+</span><span id="CategoricalClassification-800"><a href="#CategoricalClassification-800"><span class="linenos">800</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-801"><a href="#CategoricalClassification-801"><span class="linenos">801</span></a>
+</span><span id="CategoricalClassification-802"><a href="#CategoricalClassification-802"><span class="linenos">802</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification-803"><a href="#CategoricalClassification-803"><span class="linenos">803</span></a>        <span class="n">n</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="CategoricalClassification-804"><a href="#CategoricalClassification-804"><span class="linenos">804</span></a>        <span class="k">for</span> <span class="n">arr</span> <span class="ow">in</span> <span class="n">X</span><span class="p">:</span>
+</span><span id="CategoricalClassification-805"><a href="#CategoricalClassification-805"><span class="linenos">805</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;[&#39;</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-806"><a href="#CategoricalClassification-806"><span class="linenos">806</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
+</span><span id="CategoricalClassification-807"><a href="#CategoricalClassification-807"><span class="linenos">807</span></a>                <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="n">n_features</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="CategoricalClassification-808"><a href="#CategoricalClassification-808"><span class="linenos">808</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-809"><a href="#CategoricalClassification-809"><span class="linenos">809</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification-810"><a href="#CategoricalClassification-810"><span class="linenos">810</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;, &#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-811"><a href="#CategoricalClassification-811"><span class="linenos">811</span></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;], Label: </span><span class="si">{</span><span class="n">y</span><span class="p">[</span><span class="n">n</span><span class="p">]</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-812"><a href="#CategoricalClassification-812"><span class="linenos">812</span></a>            <span class="n">n</span> <span class="o">+=</span> <span class="mi">1</span>
 </span><span id="CategoricalClassification-813"><a href="#CategoricalClassification-813"><span class="linenos">813</span></a>
-</span><span id="CategoricalClassification-814"><a href="#CategoricalClassification-814"><span class="linenos">814</span></a>        <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-815"><a href="#CategoricalClassification-815"><span class="linenos">815</span></a>
-</span><span id="CategoricalClassification-816"><a href="#CategoricalClassification-816"><span class="linenos">816</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="CategoricalClassification-817"><a href="#CategoricalClassification-817"><span class="linenos">817</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Combinations:&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-818"><a href="#CategoricalClassification-818"><span class="linenos">818</span></a>            <span class="k">for</span> <span class="n">comb</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">]:</span>
-</span><span id="CategoricalClassification-819"><a href="#CategoricalClassification-819"><span class="linenos">819</span></a>                <span class="nb">print</span><span class="p">(</span>
-</span><span id="CategoricalClassification-820"><a href="#CategoricalClassification-820"><span class="linenos">820</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are in </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;combination_type&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> combination, result in </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;combination_ix&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="CategoricalClassification-821"><a href="#CategoricalClassification-821"><span class="linenos">821</span></a>                <span class="p">)</span>
-</span><span id="CategoricalClassification-822"><a href="#CategoricalClassification-822"><span class="linenos">822</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-823"><a href="#CategoricalClassification-823"><span class="linenos">823</span></a>
-</span><span id="CategoricalClassification-824"><a href="#CategoricalClassification-824"><span class="linenos">824</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="CategoricalClassification-825"><a href="#CategoricalClassification-825"><span class="linenos">825</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Correlations:&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-826"><a href="#CategoricalClassification-826"><span class="linenos">826</span></a>            <span class="k">for</span> <span class="n">corr</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">]:</span>
-</span><span id="CategoricalClassification-827"><a href="#CategoricalClassification-827"><span class="linenos">827</span></a>                <span class="nb">print</span><span class="p">(</span>
-</span><span id="CategoricalClassification-828"><a href="#CategoricalClassification-828"><span class="linenos">828</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are correlated to </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;correlated_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> with a factor of </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;correlation_factor&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="CategoricalClassification-829"><a href="#CategoricalClassification-829"><span class="linenos">829</span></a>                <span class="p">)</span>
-</span><span id="CategoricalClassification-830"><a href="#CategoricalClassification-830"><span class="linenos">830</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-831"><a href="#CategoricalClassification-831"><span class="linenos">831</span></a>
-</span><span id="CategoricalClassification-832"><a href="#CategoricalClassification-832"><span class="linenos">832</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="CategoricalClassification-833"><a href="#CategoricalClassification-833"><span class="linenos">833</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Duplicates:&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-834"><a href="#CategoricalClassification-834"><span class="linenos">834</span></a>            <span class="k">for</span> <span class="n">dup</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">]:</span>
-</span><span id="CategoricalClassification-835"><a href="#CategoricalClassification-835"><span class="linenos">835</span></a>                <span class="nb">print</span><span class="p">(</span>
-</span><span id="CategoricalClassification-836"><a href="#CategoricalClassification-836"><span class="linenos">836</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">dup</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are duplicated, duplicate indexes are </span><span class="si">{</span><span class="n">dup</span><span class="p">[</span><span class="s1">&#39;duplicate_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="CategoricalClassification-837"><a href="#CategoricalClassification-837"><span class="linenos">837</span></a>                <span class="p">)</span>
-</span><span id="CategoricalClassification-838"><a href="#CategoricalClassification-838"><span class="linenos">838</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-839"><a href="#CategoricalClassification-839"><span class="linenos">839</span></a>
-</span><span id="CategoricalClassification-840"><a href="#CategoricalClassification-840"><span class="linenos">840</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="CategoricalClassification-841"><a href="#CategoricalClassification-841"><span class="linenos">841</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Simulated noise:&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-842"><a href="#CategoricalClassification-842"><span class="linenos">842</span></a>            <span class="k">for</span> <span class="n">noise</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">]:</span>
-</span><span id="CategoricalClassification-843"><a href="#CategoricalClassification-843"><span class="linenos">843</span></a>                <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Simulated </span><span class="si">{</span><span class="n">noise</span><span class="p">[</span><span class="s1">&#39;type&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> noise, amount of </span><span class="si">{</span><span class="n">noise</span><span class="p">[</span><span class="s1">&#39;noise_amount&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-844"><a href="#CategoricalClassification-844"><span class="linenos">844</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification-845"><a href="#CategoricalClassification-845"><span class="linenos">845</span></a>
-</span><span id="CategoricalClassification-846"><a href="#CategoricalClassification-846"><span class="linenos">846</span></a>        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\n</span><span class="s2">For more information on dataset structure, print cc.dataset_info[&#39;general&#39;][&#39;structure&#39;]&quot;</span><span class="p">)</span>
+</span><span id="CategoricalClassification-814"><a href="#CategoricalClassification-814"><span class="linenos">814</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification-815"><a href="#CategoricalClassification-815"><span class="linenos">815</span></a><span class="sd">    def summarize(self):</span>
+</span><span id="CategoricalClassification-816"><a href="#CategoricalClassification-816"><span class="linenos">816</span></a><span class="sd">        # TODO: Logging function</span>
+</span><span id="CategoricalClassification-817"><a href="#CategoricalClassification-817"><span class="linenos">817</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span></pre></div>
+
+
+    
+
+                            <div id="CategoricalClassification.__init__" class="classattr">
+                                        <input id="CategoricalClassification.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">CategoricalClassification</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span></span>)</span>
+
+                <label class="view-source-button" for="CategoricalClassification.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#CategoricalClassification.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.__init__-20"><a href="#CategoricalClassification.__init__-20"><span class="linenos">20</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">):</span>
+</span><span id="CategoricalClassification.__init__-21"><a href="#CategoricalClassification.__init__-21"><span class="linenos">21</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">seed</span><span class="p">(</span><span class="n">seed</span><span class="p">)</span>
+</span><span id="CategoricalClassification.__init__-22"><a href="#CategoricalClassification.__init__-22"><span class="linenos">22</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="CategoricalClassification.__init__-23"><a href="#CategoricalClassification.__init__-23"><span class="linenos">23</span></a>            <span class="s1">&#39;general&#39;</span><span class="p">:</span> <span class="p">{},</span>
+</span><span id="CategoricalClassification.__init__-24"><a href="#CategoricalClassification.__init__-24"><span class="linenos">24</span></a>            <span class="s1">&#39;combinations&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="CategoricalClassification.__init__-25"><a href="#CategoricalClassification.__init__-25"><span class="linenos">25</span></a>            <span class="s1">&#39;correlations&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="CategoricalClassification.__init__-26"><a href="#CategoricalClassification.__init__-26"><span class="linenos">26</span></a>            <span class="s1">&#39;duplicates&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="CategoricalClassification.__init__-27"><a href="#CategoricalClassification.__init__-27"><span class="linenos">27</span></a>            <span class="s1">&#39;labels&#39;</span><span class="p">:</span> <span class="p">{},</span>
+</span><span id="CategoricalClassification.__init__-28"><a href="#CategoricalClassification.__init__-28"><span class="linenos">28</span></a>            <span class="s1">&#39;noise&#39;</span><span class="p">:</span> <span class="p">[],</span>
+</span><span id="CategoricalClassification.__init__-29"><a href="#CategoricalClassification.__init__-29"><span class="linenos">29</span></a>        <span class="p">}</span>
 </span></pre></div>
 
 
     
 
+                            </div>
                             <div id="CategoricalClassification.dataset_info" class="classattr">
                                 <div class="attr variable">
             <span class="name">dataset_info</span>
@@ -1803,137 +1771,138 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#CategoricalClassification.generate_data"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_data-33"><a href="#CategoricalClassification.generate_data-33"><span class="linenos"> 33</span></a>    <span class="k">def</span> <span class="nf">generate_data</span><span class="p">(</span>
-</span><span id="CategoricalClassification.generate_data-34"><a href="#CategoricalClassification.generate_data-34"><span class="linenos"> 34</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-35"><a href="#CategoricalClassification.generate_data-35"><span class="linenos"> 35</span></a>        <span class="n">n_features</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-36"><a href="#CategoricalClassification.generate_data-36"><span class="linenos"> 36</span></a>        <span class="n">n_samples</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-37"><a href="#CategoricalClassification.generate_data-37"><span class="linenos"> 37</span></a>        <span class="n">cardinality</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-38"><a href="#CategoricalClassification.generate_data-38"><span class="linenos"> 38</span></a>        <span class="n">structure</span><span class="p">:</span> <span class="nb">list</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-39"><a href="#CategoricalClassification.generate_data-39"><span class="linenos"> 39</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-40"><a href="#CategoricalClassification.generate_data-40"><span class="linenos"> 40</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-41"><a href="#CategoricalClassification.generate_data-41"><span class="linenos"> 41</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-42"><a href="#CategoricalClassification.generate_data-42"><span class="linenos"> 42</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-43"><a href="#CategoricalClassification.generate_data-43"><span class="linenos"> 43</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-44"><a href="#CategoricalClassification.generate_data-44"><span class="linenos"> 44</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_data-45"><a href="#CategoricalClassification.generate_data-45"><span class="linenos"> 45</span></a>
-</span><span id="CategoricalClassification.generate_data-46"><a href="#CategoricalClassification.generate_data-46"><span class="linenos"> 46</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification.generate_data-47"><a href="#CategoricalClassification.generate_data-47"><span class="linenos"> 47</span></a><span class="sd">        Generates dataset based on given parameters</span>
-</span><span id="CategoricalClassification.generate_data-48"><a href="#CategoricalClassification.generate_data-48"><span class="linenos"> 48</span></a><span class="sd">        :param n_features: number of generated features</span>
-</span><span id="CategoricalClassification.generate_data-49"><a href="#CategoricalClassification.generate_data-49"><span class="linenos"> 49</span></a><span class="sd">        :param n_samples: number of generated samples</span>
-</span><span id="CategoricalClassification.generate_data-50"><a href="#CategoricalClassification.generate_data-50"><span class="linenos"> 50</span></a><span class="sd">        :param cardinality: default cardinality of the dataset</span>
-</span><span id="CategoricalClassification.generate_data-51"><a href="#CategoricalClassification.generate_data-51"><span class="linenos"> 51</span></a><span class="sd">        :param structure: structure of the dataset</span>
-</span><span id="CategoricalClassification.generate_data-52"><a href="#CategoricalClassification.generate_data-52"><span class="linenos"> 52</span></a><span class="sd">        :param ensure_rep: flag, ensures all given values represented</span>
-</span><span id="CategoricalClassification.generate_data-53"><a href="#CategoricalClassification.generate_data-53"><span class="linenos"> 53</span></a><span class="sd">        :param random_values: flag, enables random (integer) feature values from set [low, high]</span>
-</span><span id="CategoricalClassification.generate_data-54"><a href="#CategoricalClassification.generate_data-54"><span class="linenos"> 54</span></a><span class="sd">        :param low: sets lower bound of random feature values</span>
-</span><span id="CategoricalClassification.generate_data-55"><a href="#CategoricalClassification.generate_data-55"><span class="linenos"> 55</span></a><span class="sd">        :param high: sets high bound of random feature values</span>
-</span><span id="CategoricalClassification.generate_data-56"><a href="#CategoricalClassification.generate_data-56"><span class="linenos"> 56</span></a><span class="sd">        :param seed: sets seed of numpy random</span>
-</span><span id="CategoricalClassification.generate_data-57"><a href="#CategoricalClassification.generate_data-57"><span class="linenos"> 57</span></a><span class="sd">        :return: X, 2D dataset</span>
-</span><span id="CategoricalClassification.generate_data-58"><a href="#CategoricalClassification.generate_data-58"><span class="linenos"> 58</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification.generate_data-59"><a href="#CategoricalClassification.generate_data-59"><span class="linenos"> 59</span></a>
-</span><span id="CategoricalClassification.generate_data-60"><a href="#CategoricalClassification.generate_data-60"><span class="linenos"> 60</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
-</span><span id="CategoricalClassification.generate_data-61"><a href="#CategoricalClassification.generate_data-61"><span class="linenos"> 61</span></a>            <span class="s1">&#39;general&#39;</span><span class="p">:</span> <span class="p">{</span>
-</span><span id="CategoricalClassification.generate_data-62"><a href="#CategoricalClassification.generate_data-62"><span class="linenos"> 62</span></a>                <span class="s1">&#39;n_features&#39;</span><span class="p">:</span> <span class="n">n_features</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-63"><a href="#CategoricalClassification.generate_data-63"><span class="linenos"> 63</span></a>                <span class="s1">&#39;n_samples&#39;</span><span class="p">:</span> <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-64"><a href="#CategoricalClassification.generate_data-64"><span class="linenos"> 64</span></a>                <span class="s1">&#39;cardinality&#39;</span><span class="p">:</span> <span class="n">cardinality</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-65"><a href="#CategoricalClassification.generate_data-65"><span class="linenos"> 65</span></a>                <span class="s1">&#39;structure&#39;</span><span class="p">:</span> <span class="n">structure</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-66"><a href="#CategoricalClassification.generate_data-66"><span class="linenos"> 66</span></a>                <span class="s1">&#39;ensure_rep&#39;</span><span class="p">:</span> <span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-67"><a href="#CategoricalClassification.generate_data-67"><span class="linenos"> 67</span></a>                <span class="s1">&#39;seed&#39;</span><span class="p">:</span> <span class="n">seed</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-68"><a href="#CategoricalClassification.generate_data-68"><span class="linenos"> 68</span></a>            <span class="p">},</span>
-</span><span id="CategoricalClassification.generate_data-69"><a href="#CategoricalClassification.generate_data-69"><span class="linenos"> 69</span></a>        <span class="p">})</span>
-</span><span id="CategoricalClassification.generate_data-70"><a href="#CategoricalClassification.generate_data-70"><span class="linenos"> 70</span></a>
-</span><span id="CategoricalClassification.generate_data-71"><a href="#CategoricalClassification.generate_data-71"><span class="linenos"> 71</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">seed</span><span class="p">(</span><span class="n">seed</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_data-72"><a href="#CategoricalClassification.generate_data-72"><span class="linenos"> 72</span></a>        <span class="n">X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">empty</span><span class="p">([</span><span class="n">n_features</span><span class="p">,</span> <span class="n">n_samples</span><span class="p">])</span>
-</span><span id="CategoricalClassification.generate_data-73"><a href="#CategoricalClassification.generate_data-73"><span class="linenos"> 73</span></a>
-</span><span id="CategoricalClassification.generate_data-74"><a href="#CategoricalClassification.generate_data-74"><span class="linenos"> 74</span></a>        <span class="k">if</span> <span class="n">structure</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_data-75"><a href="#CategoricalClassification.generate_data-75"><span class="linenos"> 75</span></a>            <span class="c1"># No specific structure parameter passed</span>
-</span><span id="CategoricalClassification.generate_data-76"><a href="#CategoricalClassification.generate_data-76"><span class="linenos"> 76</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
-</span><span id="CategoricalClassification.generate_data-77"><a href="#CategoricalClassification.generate_data-77"><span class="linenos"> 77</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="CategoricalClassification.generate_data-78"><a href="#CategoricalClassification.generate_data-78"><span class="linenos"> 78</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-79"><a href="#CategoricalClassification.generate_data-79"><span class="linenos"> 79</span></a>                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-80"><a href="#CategoricalClassification.generate_data-80"><span class="linenos"> 80</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-81"><a href="#CategoricalClassification.generate_data-81"><span class="linenos"> 81</span></a>                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-82"><a href="#CategoricalClassification.generate_data-82"><span class="linenos"> 82</span></a>                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-83"><a href="#CategoricalClassification.generate_data-83"><span class="linenos"> 83</span></a>                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-84"><a href="#CategoricalClassification.generate_data-84"><span class="linenos"> 84</span></a>                <span class="p">)</span>
-</span><span id="CategoricalClassification.generate_data-85"><a href="#CategoricalClassification.generate_data-85"><span class="linenos"> 85</span></a>                <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="CategoricalClassification.generate_data-86"><a href="#CategoricalClassification.generate_data-86"><span class="linenos"> 86</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_data-87"><a href="#CategoricalClassification.generate_data-87"><span class="linenos"> 87</span></a>            <span class="c1"># Structure parameter passed, building based on structure</span>
-</span><span id="CategoricalClassification.generate_data-88"><a href="#CategoricalClassification.generate_data-88"><span class="linenos"> 88</span></a>            <span class="n">ix</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="CategoricalClassification.generate_data-89"><a href="#CategoricalClassification.generate_data-89"><span class="linenos"> 89</span></a>            <span class="k">for</span> <span class="n">data</span> <span class="ow">in</span> <span class="n">structure</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_data-90"><a href="#CategoricalClassification.generate_data-90"><span class="linenos"> 90</span></a>                <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">data</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="CategoricalClassification.generate_data-91"><a href="#CategoricalClassification.generate_data-91"><span class="linenos"> 91</span></a>                    <span class="c1"># Data in structure is a tuple of (feature index (integer), feature attributes)</span>
-</span><span id="CategoricalClassification.generate_data-92"><a href="#CategoricalClassification.generate_data-92"><span class="linenos"> 92</span></a>                    <span class="n">feature_ix</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
-</span><span id="CategoricalClassification.generate_data-93"><a href="#CategoricalClassification.generate_data-93"><span class="linenos"> 93</span></a>
-</span><span id="CategoricalClassification.generate_data-94"><a href="#CategoricalClassification.generate_data-94"><span class="linenos"> 94</span></a>                    <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_data-95"><a href="#CategoricalClassification.generate_data-95"><span class="linenos"> 95</span></a>                        <span class="c1"># Filling out the dataset up to column index feature_ix</span>
-</span><span id="CategoricalClassification.generate_data-96"><a href="#CategoricalClassification.generate_data-96"><span class="linenos"> 96</span></a>                        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
-</span><span id="CategoricalClassification.generate_data-97"><a href="#CategoricalClassification.generate_data-97"><span class="linenos"> 97</span></a>                            <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="CategoricalClassification.generate_data-98"><a href="#CategoricalClassification.generate_data-98"><span class="linenos"> 98</span></a>                                <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-99"><a href="#CategoricalClassification.generate_data-99"><span class="linenos"> 99</span></a>                                <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-100"><a href="#CategoricalClassification.generate_data-100"><span class="linenos">100</span></a>                                <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-101"><a href="#CategoricalClassification.generate_data-101"><span class="linenos">101</span></a>                                <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-102"><a href="#CategoricalClassification.generate_data-102"><span class="linenos">102</span></a>                                <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-103"><a href="#CategoricalClassification.generate_data-103"><span class="linenos">103</span></a>                                <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-104"><a href="#CategoricalClassification.generate_data-104"><span class="linenos">104</span></a>                            <span class="p">)</span>
-</span><span id="CategoricalClassification.generate_data-105"><a href="#CategoricalClassification.generate_data-105"><span class="linenos">105</span></a>                            <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="CategoricalClassification.generate_data-106"><a href="#CategoricalClassification.generate_data-106"><span class="linenos">106</span></a>                            <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="CategoricalClassification.generate_data-107"><a href="#CategoricalClassification.generate_data-107"><span class="linenos">107</span></a>
-</span><span id="CategoricalClassification.generate_data-108"><a href="#CategoricalClassification.generate_data-108"><span class="linenos">108</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
-</span><span id="CategoricalClassification.generate_data-109"><a href="#CategoricalClassification.generate_data-109"><span class="linenos">109</span></a>                        <span class="n">feature_attributes</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-110"><a href="#CategoricalClassification.generate_data-110"><span class="linenos">110</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-111"><a href="#CategoricalClassification.generate_data-111"><span class="linenos">111</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-112"><a href="#CategoricalClassification.generate_data-112"><span class="linenos">112</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-113"><a href="#CategoricalClassification.generate_data-113"><span class="linenos">113</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-114"><a href="#CategoricalClassification.generate_data-114"><span class="linenos">114</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-115"><a href="#CategoricalClassification.generate_data-115"><span class="linenos">115</span></a>                    <span class="p">)</span>
-</span><span id="CategoricalClassification.generate_data-116"><a href="#CategoricalClassification.generate_data-116"><span class="linenos">116</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="CategoricalClassification.generate_data-117"><a href="#CategoricalClassification.generate_data-117"><span class="linenos">117</span></a>                    <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="CategoricalClassification.generate_data-118"><a href="#CategoricalClassification.generate_data-118"><span class="linenos">118</span></a>
-</span><span id="CategoricalClassification.generate_data-119"><a href="#CategoricalClassification.generate_data-119"><span class="linenos">119</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_data-120"><a href="#CategoricalClassification.generate_data-120"><span class="linenos">120</span></a>                    <span class="c1"># Data in structure is a tuple of (list of feature indexes, feature attributes)</span>
-</span><span id="CategoricalClassification.generate_data-121"><a href="#CategoricalClassification.generate_data-121"><span class="linenos">121</span></a>                    <span class="n">feature_ixs</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
-</span><span id="CategoricalClassification.generate_data-122"><a href="#CategoricalClassification.generate_data-122"><span class="linenos">122</span></a>
-</span><span id="CategoricalClassification.generate_data-123"><a href="#CategoricalClassification.generate_data-123"><span class="linenos">123</span></a>                    <span class="k">for</span> <span class="n">feature_ix</span> <span class="ow">in</span> <span class="n">feature_ixs</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_data-124"><a href="#CategoricalClassification.generate_data-124"><span class="linenos">124</span></a>                        <span class="c1"># Filling out the dataset up to feature_ix</span>
-</span><span id="CategoricalClassification.generate_data-125"><a href="#CategoricalClassification.generate_data-125"><span class="linenos">125</span></a>                        <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_data-126"><a href="#CategoricalClassification.generate_data-126"><span class="linenos">126</span></a>                            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
-</span><span id="CategoricalClassification.generate_data-127"><a href="#CategoricalClassification.generate_data-127"><span class="linenos">127</span></a>                                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="CategoricalClassification.generate_data-128"><a href="#CategoricalClassification.generate_data-128"><span class="linenos">128</span></a>                                    <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-129"><a href="#CategoricalClassification.generate_data-129"><span class="linenos">129</span></a>                                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-130"><a href="#CategoricalClassification.generate_data-130"><span class="linenos">130</span></a>                                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-131"><a href="#CategoricalClassification.generate_data-131"><span class="linenos">131</span></a>                                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-132"><a href="#CategoricalClassification.generate_data-132"><span class="linenos">132</span></a>                                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-133"><a href="#CategoricalClassification.generate_data-133"><span class="linenos">133</span></a>                                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-134"><a href="#CategoricalClassification.generate_data-134"><span class="linenos">134</span></a>                                <span class="p">)</span>
-</span><span id="CategoricalClassification.generate_data-135"><a href="#CategoricalClassification.generate_data-135"><span class="linenos">135</span></a>                                <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="CategoricalClassification.generate_data-136"><a href="#CategoricalClassification.generate_data-136"><span class="linenos">136</span></a>                                <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="CategoricalClassification.generate_data-137"><a href="#CategoricalClassification.generate_data-137"><span class="linenos">137</span></a>
-</span><span id="CategoricalClassification.generate_data-138"><a href="#CategoricalClassification.generate_data-138"><span class="linenos">138</span></a>                        <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
-</span><span id="CategoricalClassification.generate_data-139"><a href="#CategoricalClassification.generate_data-139"><span class="linenos">139</span></a>                            <span class="n">feature_attributes</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-140"><a href="#CategoricalClassification.generate_data-140"><span class="linenos">140</span></a>                            <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-141"><a href="#CategoricalClassification.generate_data-141"><span class="linenos">141</span></a>                            <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-142"><a href="#CategoricalClassification.generate_data-142"><span class="linenos">142</span></a>                            <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-143"><a href="#CategoricalClassification.generate_data-143"><span class="linenos">143</span></a>                            <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-144"><a href="#CategoricalClassification.generate_data-144"><span class="linenos">144</span></a>                            <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-145"><a href="#CategoricalClassification.generate_data-145"><span class="linenos">145</span></a>                        <span class="p">)</span>
-</span><span id="CategoricalClassification.generate_data-146"><a href="#CategoricalClassification.generate_data-146"><span class="linenos">146</span></a>
-</span><span id="CategoricalClassification.generate_data-147"><a href="#CategoricalClassification.generate_data-147"><span class="linenos">147</span></a>                        <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="CategoricalClassification.generate_data-148"><a href="#CategoricalClassification.generate_data-148"><span class="linenos">148</span></a>                        <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="CategoricalClassification.generate_data-149"><a href="#CategoricalClassification.generate_data-149"><span class="linenos">149</span></a>
-</span><span id="CategoricalClassification.generate_data-150"><a href="#CategoricalClassification.generate_data-150"><span class="linenos">150</span></a>            <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">n_features</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_data-151"><a href="#CategoricalClassification.generate_data-151"><span class="linenos">151</span></a>                <span class="c1"># Fill out the rest of the dataset</span>
-</span><span id="CategoricalClassification.generate_data-152"><a href="#CategoricalClassification.generate_data-152"><span class="linenos">152</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">n_features</span><span class="p">):</span>
-</span><span id="CategoricalClassification.generate_data-153"><a href="#CategoricalClassification.generate_data-153"><span class="linenos">153</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
-</span><span id="CategoricalClassification.generate_data-154"><a href="#CategoricalClassification.generate_data-154"><span class="linenos">154</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-155"><a href="#CategoricalClassification.generate_data-155"><span class="linenos">155</span></a>                        <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-156"><a href="#CategoricalClassification.generate_data-156"><span class="linenos">156</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-157"><a href="#CategoricalClassification.generate_data-157"><span class="linenos">157</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-158"><a href="#CategoricalClassification.generate_data-158"><span class="linenos">158</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-159"><a href="#CategoricalClassification.generate_data-159"><span class="linenos">159</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_data-160"><a href="#CategoricalClassification.generate_data-160"><span class="linenos">160</span></a>                    <span class="p">)</span>
-</span><span id="CategoricalClassification.generate_data-161"><a href="#CategoricalClassification.generate_data-161"><span class="linenos">161</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
-</span><span id="CategoricalClassification.generate_data-162"><a href="#CategoricalClassification.generate_data-162"><span class="linenos">162</span></a>
-</span><span id="CategoricalClassification.generate_data-163"><a href="#CategoricalClassification.generate_data-163"><span class="linenos">163</span></a>        <span class="k">return</span> <span class="n">X</span><span class="o">.</span><span class="n">T</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_data-34"><a href="#CategoricalClassification.generate_data-34"><span class="linenos"> 34</span></a>    <span class="k">def</span> <span class="nf">generate_data</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_data-35"><a href="#CategoricalClassification.generate_data-35"><span class="linenos"> 35</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-36"><a href="#CategoricalClassification.generate_data-36"><span class="linenos"> 36</span></a>        <span class="n">n_features</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-37"><a href="#CategoricalClassification.generate_data-37"><span class="linenos"> 37</span></a>        <span class="n">n_samples</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-38"><a href="#CategoricalClassification.generate_data-38"><span class="linenos"> 38</span></a>        <span class="n">cardinality</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-39"><a href="#CategoricalClassification.generate_data-39"><span class="linenos"> 39</span></a>        <span class="n">structure</span><span class="p">:</span> <span class="nb">list</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-40"><a href="#CategoricalClassification.generate_data-40"><span class="linenos"> 40</span></a>        <span class="n">ensure_rep</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-41"><a href="#CategoricalClassification.generate_data-41"><span class="linenos"> 41</span></a>        <span class="n">random_values</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-42"><a href="#CategoricalClassification.generate_data-42"><span class="linenos"> 42</span></a>        <span class="n">low</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">0</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-43"><a href="#CategoricalClassification.generate_data-43"><span class="linenos"> 43</span></a>        <span class="n">high</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="mi">1000</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-44"><a href="#CategoricalClassification.generate_data-44"><span class="linenos"> 44</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-45"><a href="#CategoricalClassification.generate_data-45"><span class="linenos"> 45</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-46"><a href="#CategoricalClassification.generate_data-46"><span class="linenos"> 46</span></a>
+</span><span id="CategoricalClassification.generate_data-47"><a href="#CategoricalClassification.generate_data-47"><span class="linenos"> 47</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_data-48"><a href="#CategoricalClassification.generate_data-48"><span class="linenos"> 48</span></a><span class="sd">        Generates dataset based on given parameters</span>
+</span><span id="CategoricalClassification.generate_data-49"><a href="#CategoricalClassification.generate_data-49"><span class="linenos"> 49</span></a><span class="sd">        :param n_features: number of generated features</span>
+</span><span id="CategoricalClassification.generate_data-50"><a href="#CategoricalClassification.generate_data-50"><span class="linenos"> 50</span></a><span class="sd">        :param n_samples: number of generated samples</span>
+</span><span id="CategoricalClassification.generate_data-51"><a href="#CategoricalClassification.generate_data-51"><span class="linenos"> 51</span></a><span class="sd">        :param cardinality: default cardinality of the dataset</span>
+</span><span id="CategoricalClassification.generate_data-52"><a href="#CategoricalClassification.generate_data-52"><span class="linenos"> 52</span></a><span class="sd">        :param structure: structure of the dataset</span>
+</span><span id="CategoricalClassification.generate_data-53"><a href="#CategoricalClassification.generate_data-53"><span class="linenos"> 53</span></a><span class="sd">        :param ensure_rep: flag, ensures all given values represented</span>
+</span><span id="CategoricalClassification.generate_data-54"><a href="#CategoricalClassification.generate_data-54"><span class="linenos"> 54</span></a><span class="sd">        :param random_values: flag, enables random (integer) feature values from set [low, high]</span>
+</span><span id="CategoricalClassification.generate_data-55"><a href="#CategoricalClassification.generate_data-55"><span class="linenos"> 55</span></a><span class="sd">        :param low: sets lower bound of random feature values</span>
+</span><span id="CategoricalClassification.generate_data-56"><a href="#CategoricalClassification.generate_data-56"><span class="linenos"> 56</span></a><span class="sd">        :param high: sets high bound of random feature values</span>
+</span><span id="CategoricalClassification.generate_data-57"><a href="#CategoricalClassification.generate_data-57"><span class="linenos"> 57</span></a><span class="sd">        :param seed: sets seed of numpy random</span>
+</span><span id="CategoricalClassification.generate_data-58"><a href="#CategoricalClassification.generate_data-58"><span class="linenos"> 58</span></a><span class="sd">        :return: X, 2D dataset</span>
+</span><span id="CategoricalClassification.generate_data-59"><a href="#CategoricalClassification.generate_data-59"><span class="linenos"> 59</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_data-60"><a href="#CategoricalClassification.generate_data-60"><span class="linenos"> 60</span></a>
+</span><span id="CategoricalClassification.generate_data-61"><a href="#CategoricalClassification.generate_data-61"><span class="linenos"> 61</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="CategoricalClassification.generate_data-62"><a href="#CategoricalClassification.generate_data-62"><span class="linenos"> 62</span></a>            <span class="s1">&#39;general&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="CategoricalClassification.generate_data-63"><a href="#CategoricalClassification.generate_data-63"><span class="linenos"> 63</span></a>                <span class="s1">&#39;n_features&#39;</span><span class="p">:</span> <span class="n">n_features</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-64"><a href="#CategoricalClassification.generate_data-64"><span class="linenos"> 64</span></a>                <span class="s1">&#39;n_samples&#39;</span><span class="p">:</span> <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-65"><a href="#CategoricalClassification.generate_data-65"><span class="linenos"> 65</span></a>                <span class="s1">&#39;cardinality&#39;</span><span class="p">:</span> <span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-66"><a href="#CategoricalClassification.generate_data-66"><span class="linenos"> 66</span></a>                <span class="s1">&#39;structure&#39;</span><span class="p">:</span> <span class="n">structure</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-67"><a href="#CategoricalClassification.generate_data-67"><span class="linenos"> 67</span></a>                <span class="s1">&#39;ensure_rep&#39;</span><span class="p">:</span> <span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-68"><a href="#CategoricalClassification.generate_data-68"><span class="linenos"> 68</span></a>                <span class="s1">&#39;seed&#39;</span><span class="p">:</span> <span class="n">seed</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-69"><a href="#CategoricalClassification.generate_data-69"><span class="linenos"> 69</span></a>            <span class="p">},</span>
+</span><span id="CategoricalClassification.generate_data-70"><a href="#CategoricalClassification.generate_data-70"><span class="linenos"> 70</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification.generate_data-71"><a href="#CategoricalClassification.generate_data-71"><span class="linenos"> 71</span></a>
+</span><span id="CategoricalClassification.generate_data-72"><a href="#CategoricalClassification.generate_data-72"><span class="linenos"> 72</span></a>        <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">seed</span><span class="p">(</span><span class="n">seed</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_data-73"><a href="#CategoricalClassification.generate_data-73"><span class="linenos"> 73</span></a>        <span class="n">X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">empty</span><span class="p">([</span><span class="n">n_features</span><span class="p">,</span> <span class="n">n_samples</span><span class="p">])</span>
+</span><span id="CategoricalClassification.generate_data-74"><a href="#CategoricalClassification.generate_data-74"><span class="linenos"> 74</span></a>
+</span><span id="CategoricalClassification.generate_data-75"><a href="#CategoricalClassification.generate_data-75"><span class="linenos"> 75</span></a>        <span class="c1"># No specific structure parameter passed</span>
+</span><span id="CategoricalClassification.generate_data-76"><a href="#CategoricalClassification.generate_data-76"><span class="linenos"> 76</span></a>        <span class="k">if</span> <span class="n">structure</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-77"><a href="#CategoricalClassification.generate_data-77"><span class="linenos"> 77</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
+</span><span id="CategoricalClassification.generate_data-78"><a href="#CategoricalClassification.generate_data-78"><span class="linenos"> 78</span></a>                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_data-79"><a href="#CategoricalClassification.generate_data-79"><span class="linenos"> 79</span></a>                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-80"><a href="#CategoricalClassification.generate_data-80"><span class="linenos"> 80</span></a>                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-81"><a href="#CategoricalClassification.generate_data-81"><span class="linenos"> 81</span></a>                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-82"><a href="#CategoricalClassification.generate_data-82"><span class="linenos"> 82</span></a>                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-83"><a href="#CategoricalClassification.generate_data-83"><span class="linenos"> 83</span></a>                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-84"><a href="#CategoricalClassification.generate_data-84"><span class="linenos"> 84</span></a>                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-85"><a href="#CategoricalClassification.generate_data-85"><span class="linenos"> 85</span></a>                <span class="p">)</span>
+</span><span id="CategoricalClassification.generate_data-86"><a href="#CategoricalClassification.generate_data-86"><span class="linenos"> 86</span></a>                <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification.generate_data-87"><a href="#CategoricalClassification.generate_data-87"><span class="linenos"> 87</span></a>        <span class="c1"># Structure parameter passed, building based on structure</span>
+</span><span id="CategoricalClassification.generate_data-88"><a href="#CategoricalClassification.generate_data-88"><span class="linenos"> 88</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-89"><a href="#CategoricalClassification.generate_data-89"><span class="linenos"> 89</span></a>            <span class="n">ix</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="CategoricalClassification.generate_data-90"><a href="#CategoricalClassification.generate_data-90"><span class="linenos"> 90</span></a>            <span class="k">for</span> <span class="n">data</span> <span class="ow">in</span> <span class="n">structure</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-91"><a href="#CategoricalClassification.generate_data-91"><span class="linenos"> 91</span></a>
+</span><span id="CategoricalClassification.generate_data-92"><a href="#CategoricalClassification.generate_data-92"><span class="linenos"> 92</span></a>                <span class="c1"># Data in structure is a tuple of (feature index (integer), feature attributes)</span>
+</span><span id="CategoricalClassification.generate_data-93"><a href="#CategoricalClassification.generate_data-93"><span class="linenos"> 93</span></a>                <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">data</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification.generate_data-94"><a href="#CategoricalClassification.generate_data-94"><span class="linenos"> 94</span></a>                    <span class="n">feature_ix</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
+</span><span id="CategoricalClassification.generate_data-95"><a href="#CategoricalClassification.generate_data-95"><span class="linenos"> 95</span></a>
+</span><span id="CategoricalClassification.generate_data-96"><a href="#CategoricalClassification.generate_data-96"><span class="linenos"> 96</span></a>                    <span class="c1"># Filling out the dataset up to column index feature_ix</span>
+</span><span id="CategoricalClassification.generate_data-97"><a href="#CategoricalClassification.generate_data-97"><span class="linenos"> 97</span></a>                    <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-98"><a href="#CategoricalClassification.generate_data-98"><span class="linenos"> 98</span></a>                        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
+</span><span id="CategoricalClassification.generate_data-99"><a href="#CategoricalClassification.generate_data-99"><span class="linenos"> 99</span></a>                            <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_data-100"><a href="#CategoricalClassification.generate_data-100"><span class="linenos">100</span></a>                                <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-101"><a href="#CategoricalClassification.generate_data-101"><span class="linenos">101</span></a>                                <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-102"><a href="#CategoricalClassification.generate_data-102"><span class="linenos">102</span></a>                                <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-103"><a href="#CategoricalClassification.generate_data-103"><span class="linenos">103</span></a>                                <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-104"><a href="#CategoricalClassification.generate_data-104"><span class="linenos">104</span></a>                                <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-105"><a href="#CategoricalClassification.generate_data-105"><span class="linenos">105</span></a>                                <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-106"><a href="#CategoricalClassification.generate_data-106"><span class="linenos">106</span></a>                            <span class="p">)</span>
+</span><span id="CategoricalClassification.generate_data-107"><a href="#CategoricalClassification.generate_data-107"><span class="linenos">107</span></a>                            <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification.generate_data-108"><a href="#CategoricalClassification.generate_data-108"><span class="linenos">108</span></a>                            <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification.generate_data-109"><a href="#CategoricalClassification.generate_data-109"><span class="linenos">109</span></a>
+</span><span id="CategoricalClassification.generate_data-110"><a href="#CategoricalClassification.generate_data-110"><span class="linenos">110</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_data-111"><a href="#CategoricalClassification.generate_data-111"><span class="linenos">111</span></a>                        <span class="n">feature_attributes</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-112"><a href="#CategoricalClassification.generate_data-112"><span class="linenos">112</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-113"><a href="#CategoricalClassification.generate_data-113"><span class="linenos">113</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-114"><a href="#CategoricalClassification.generate_data-114"><span class="linenos">114</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-115"><a href="#CategoricalClassification.generate_data-115"><span class="linenos">115</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-116"><a href="#CategoricalClassification.generate_data-116"><span class="linenos">116</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-117"><a href="#CategoricalClassification.generate_data-117"><span class="linenos">117</span></a>                    <span class="p">)</span>
+</span><span id="CategoricalClassification.generate_data-118"><a href="#CategoricalClassification.generate_data-118"><span class="linenos">118</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification.generate_data-119"><a href="#CategoricalClassification.generate_data-119"><span class="linenos">119</span></a>                    <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification.generate_data-120"><a href="#CategoricalClassification.generate_data-120"><span class="linenos">120</span></a>
+</span><span id="CategoricalClassification.generate_data-121"><a href="#CategoricalClassification.generate_data-121"><span class="linenos">121</span></a>                <span class="c1"># Data in structure is a tuple of (list of feature indexes, feature attributes)</span>
+</span><span id="CategoricalClassification.generate_data-122"><a href="#CategoricalClassification.generate_data-122"><span class="linenos">122</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-123"><a href="#CategoricalClassification.generate_data-123"><span class="linenos">123</span></a>                    <span class="n">feature_ixs</span><span class="p">,</span> <span class="n">feature_attributes</span> <span class="o">=</span> <span class="n">data</span>
+</span><span id="CategoricalClassification.generate_data-124"><a href="#CategoricalClassification.generate_data-124"><span class="linenos">124</span></a>
+</span><span id="CategoricalClassification.generate_data-125"><a href="#CategoricalClassification.generate_data-125"><span class="linenos">125</span></a>                    <span class="c1"># Filling out the dataset up to feature_ix</span>
+</span><span id="CategoricalClassification.generate_data-126"><a href="#CategoricalClassification.generate_data-126"><span class="linenos">126</span></a>                    <span class="k">for</span> <span class="n">feature_ix</span> <span class="ow">in</span> <span class="n">feature_ixs</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-127"><a href="#CategoricalClassification.generate_data-127"><span class="linenos">127</span></a>                        <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">feature_ix</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-128"><a href="#CategoricalClassification.generate_data-128"><span class="linenos">128</span></a>                            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">feature_ix</span><span class="p">):</span>
+</span><span id="CategoricalClassification.generate_data-129"><a href="#CategoricalClassification.generate_data-129"><span class="linenos">129</span></a>                                <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_data-130"><a href="#CategoricalClassification.generate_data-130"><span class="linenos">130</span></a>                                    <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-131"><a href="#CategoricalClassification.generate_data-131"><span class="linenos">131</span></a>                                    <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-132"><a href="#CategoricalClassification.generate_data-132"><span class="linenos">132</span></a>                                    <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-133"><a href="#CategoricalClassification.generate_data-133"><span class="linenos">133</span></a>                                    <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-134"><a href="#CategoricalClassification.generate_data-134"><span class="linenos">134</span></a>                                    <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-135"><a href="#CategoricalClassification.generate_data-135"><span class="linenos">135</span></a>                                    <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-136"><a href="#CategoricalClassification.generate_data-136"><span class="linenos">136</span></a>                                <span class="p">)</span>
+</span><span id="CategoricalClassification.generate_data-137"><a href="#CategoricalClassification.generate_data-137"><span class="linenos">137</span></a>                                <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification.generate_data-138"><a href="#CategoricalClassification.generate_data-138"><span class="linenos">138</span></a>                                <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification.generate_data-139"><a href="#CategoricalClassification.generate_data-139"><span class="linenos">139</span></a>
+</span><span id="CategoricalClassification.generate_data-140"><a href="#CategoricalClassification.generate_data-140"><span class="linenos">140</span></a>                        <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_configure_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_data-141"><a href="#CategoricalClassification.generate_data-141"><span class="linenos">141</span></a>                            <span class="n">feature_attributes</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-142"><a href="#CategoricalClassification.generate_data-142"><span class="linenos">142</span></a>                            <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-143"><a href="#CategoricalClassification.generate_data-143"><span class="linenos">143</span></a>                            <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-144"><a href="#CategoricalClassification.generate_data-144"><span class="linenos">144</span></a>                            <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-145"><a href="#CategoricalClassification.generate_data-145"><span class="linenos">145</span></a>                            <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-146"><a href="#CategoricalClassification.generate_data-146"><span class="linenos">146</span></a>                            <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-147"><a href="#CategoricalClassification.generate_data-147"><span class="linenos">147</span></a>                        <span class="p">)</span>
+</span><span id="CategoricalClassification.generate_data-148"><a href="#CategoricalClassification.generate_data-148"><span class="linenos">148</span></a>
+</span><span id="CategoricalClassification.generate_data-149"><a href="#CategoricalClassification.generate_data-149"><span class="linenos">149</span></a>                        <span class="n">X</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification.generate_data-150"><a href="#CategoricalClassification.generate_data-150"><span class="linenos">150</span></a>                        <span class="n">ix</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification.generate_data-151"><a href="#CategoricalClassification.generate_data-151"><span class="linenos">151</span></a>
+</span><span id="CategoricalClassification.generate_data-152"><a href="#CategoricalClassification.generate_data-152"><span class="linenos">152</span></a>            <span class="c1"># Fill out the rest of the dataset</span>
+</span><span id="CategoricalClassification.generate_data-153"><a href="#CategoricalClassification.generate_data-153"><span class="linenos">153</span></a>            <span class="k">if</span> <span class="n">ix</span> <span class="o">&lt;</span> <span class="n">n_features</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_data-154"><a href="#CategoricalClassification.generate_data-154"><span class="linenos">154</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">ix</span><span class="p">,</span> <span class="n">n_features</span><span class="p">):</span>
+</span><span id="CategoricalClassification.generate_data-155"><a href="#CategoricalClassification.generate_data-155"><span class="linenos">155</span></a>                    <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_generate_feature</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_data-156"><a href="#CategoricalClassification.generate_data-156"><span class="linenos">156</span></a>                        <span class="n">n_samples</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-157"><a href="#CategoricalClassification.generate_data-157"><span class="linenos">157</span></a>                        <span class="n">cardinality</span><span class="o">=</span><span class="n">cardinality</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-158"><a href="#CategoricalClassification.generate_data-158"><span class="linenos">158</span></a>                        <span class="n">ensure_rep</span><span class="o">=</span><span class="n">ensure_rep</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-159"><a href="#CategoricalClassification.generate_data-159"><span class="linenos">159</span></a>                        <span class="n">random_values</span><span class="o">=</span><span class="n">random_values</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-160"><a href="#CategoricalClassification.generate_data-160"><span class="linenos">160</span></a>                        <span class="n">low</span><span class="o">=</span><span class="n">low</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-161"><a href="#CategoricalClassification.generate_data-161"><span class="linenos">161</span></a>                        <span class="n">high</span><span class="o">=</span><span class="n">high</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_data-162"><a href="#CategoricalClassification.generate_data-162"><span class="linenos">162</span></a>                    <span class="p">)</span>
+</span><span id="CategoricalClassification.generate_data-163"><a href="#CategoricalClassification.generate_data-163"><span class="linenos">163</span></a>                    <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">x</span>
+</span><span id="CategoricalClassification.generate_data-164"><a href="#CategoricalClassification.generate_data-164"><span class="linenos">164</span></a>
+</span><span id="CategoricalClassification.generate_data-165"><a href="#CategoricalClassification.generate_data-165"><span class="linenos">165</span></a>        <span class="k">return</span> <span class="n">X</span><span class="o">.</span><span class="n">T</span>
 </span></pre></div>
 
 
@@ -1967,49 +1936,49 @@ <h6 id="returns">Returns</h6>
 <div class="attr function">
             
         <span class="def">def</span>
-        <span class="name">generate_combinations</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">X</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">feature_indices</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">combination_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">combination_type</span><span class="p">:</span> <span class="n">Literal</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span></span><span class="return-annotation">) -> <span class="n">numpy</span><span class="o">.</span><span class="n">ndarray</span>:</span></span>
+        <span class="name">generate_combinations</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">X</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">feature_indices</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">combination_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">combination_type</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;linear&#39;</span><span class="p">,</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span></span><span class="return-annotation">) -> <span class="n">numpy</span><span class="o">.</span><span class="n">ndarray</span>:</span></span>
 
                 <label class="view-source-button" for="CategoricalClassification.generate_combinations-view-source"><span>View Source</span></label>
 
     </div>
     <a class="headerlink" href="#CategoricalClassification.generate_combinations"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_combinations-267"><a href="#CategoricalClassification.generate_combinations-267"><span class="linenos">267</span></a>    <span class="k">def</span> <span class="nf">generate_combinations</span><span class="p">(</span>
-</span><span id="CategoricalClassification.generate_combinations-268"><a href="#CategoricalClassification.generate_combinations-268"><span class="linenos">268</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_combinations-269"><a href="#CategoricalClassification.generate_combinations-269"><span class="linenos">269</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_combinations-270"><a href="#CategoricalClassification.generate_combinations-270"><span class="linenos">270</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_combinations-271"><a href="#CategoricalClassification.generate_combinations-271"><span class="linenos">271</span></a>        <span class="n">combination_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_combinations-272"><a href="#CategoricalClassification.generate_combinations-272"><span class="linenos">272</span></a>        <span class="n">combination_type</span><span class="p">:</span> <span class="n">Literal</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_combinations-273"><a href="#CategoricalClassification.generate_combinations-273"><span class="linenos">273</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_combinations-274"><a href="#CategoricalClassification.generate_combinations-274"><span class="linenos">274</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification.generate_combinations-275"><a href="#CategoricalClassification.generate_combinations-275"><span class="linenos">275</span></a><span class="sd">        Generates linear, nonlinear, or custom combinations within feature vectors in given dataset X</span>
-</span><span id="CategoricalClassification.generate_combinations-276"><a href="#CategoricalClassification.generate_combinations-276"><span class="linenos">276</span></a><span class="sd">        :param X: dataset</span>
-</span><span id="CategoricalClassification.generate_combinations-277"><a href="#CategoricalClassification.generate_combinations-277"><span class="linenos">277</span></a><span class="sd">        :param feature_indices: indexes of features to be in combination</span>
-</span><span id="CategoricalClassification.generate_combinations-278"><a href="#CategoricalClassification.generate_combinations-278"><span class="linenos">278</span></a><span class="sd">        :param combination_function: optional custom function for combining feature vectors</span>
-</span><span id="CategoricalClassification.generate_combinations-279"><a href="#CategoricalClassification.generate_combinations-279"><span class="linenos">279</span></a><span class="sd">        :param combination_type: string flag, either liner or nonlinear, defining combination type</span>
-</span><span id="CategoricalClassification.generate_combinations-280"><a href="#CategoricalClassification.generate_combinations-280"><span class="linenos">280</span></a><span class="sd">        :return: X with added resultant feature</span>
-</span><span id="CategoricalClassification.generate_combinations-281"><a href="#CategoricalClassification.generate_combinations-281"><span class="linenos">281</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification.generate_combinations-282"><a href="#CategoricalClassification.generate_combinations-282"><span class="linenos">282</span></a>
-</span><span id="CategoricalClassification.generate_combinations-283"><a href="#CategoricalClassification.generate_combinations-283"><span class="linenos">283</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_combinations-269"><a href="#CategoricalClassification.generate_combinations-269"><span class="linenos">269</span></a>    <span class="k">def</span> <span class="nf">generate_combinations</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_combinations-270"><a href="#CategoricalClassification.generate_combinations-270"><span class="linenos">270</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_combinations-271"><a href="#CategoricalClassification.generate_combinations-271"><span class="linenos">271</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_combinations-272"><a href="#CategoricalClassification.generate_combinations-272"><span class="linenos">272</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_combinations-273"><a href="#CategoricalClassification.generate_combinations-273"><span class="linenos">273</span></a>        <span class="n">combination_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_combinations-274"><a href="#CategoricalClassification.generate_combinations-274"><span class="linenos">274</span></a>        <span class="n">combination_type</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;linear&#39;</span><span class="p">,</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_combinations-275"><a href="#CategoricalClassification.generate_combinations-275"><span class="linenos">275</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_combinations-276"><a href="#CategoricalClassification.generate_combinations-276"><span class="linenos">276</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_combinations-277"><a href="#CategoricalClassification.generate_combinations-277"><span class="linenos">277</span></a><span class="sd">        Generates linear, nonlinear, or custom combinations within feature vectors in given dataset X</span>
+</span><span id="CategoricalClassification.generate_combinations-278"><a href="#CategoricalClassification.generate_combinations-278"><span class="linenos">278</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification.generate_combinations-279"><a href="#CategoricalClassification.generate_combinations-279"><span class="linenos">279</span></a><span class="sd">        :param feature_indices: indexes of features to be in combination</span>
+</span><span id="CategoricalClassification.generate_combinations-280"><a href="#CategoricalClassification.generate_combinations-280"><span class="linenos">280</span></a><span class="sd">        :param combination_function: optional custom function for combining feature vectors</span>
+</span><span id="CategoricalClassification.generate_combinations-281"><a href="#CategoricalClassification.generate_combinations-281"><span class="linenos">281</span></a><span class="sd">        :param combination_type: string flag, either liner or nonlinear, defining combination type</span>
+</span><span id="CategoricalClassification.generate_combinations-282"><a href="#CategoricalClassification.generate_combinations-282"><span class="linenos">282</span></a><span class="sd">        :return: X with added resultant feature</span>
+</span><span id="CategoricalClassification.generate_combinations-283"><a href="#CategoricalClassification.generate_combinations-283"><span class="linenos">283</span></a><span class="sd">        &quot;&quot;&quot;</span>
 </span><span id="CategoricalClassification.generate_combinations-284"><a href="#CategoricalClassification.generate_combinations-284"><span class="linenos">284</span></a>
-</span><span id="CategoricalClassification.generate_combinations-285"><a href="#CategoricalClassification.generate_combinations-285"><span class="linenos">285</span></a>        <span class="k">if</span> <span class="n">combination_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_combinations-286"><a href="#CategoricalClassification.generate_combinations-286"><span class="linenos">286</span></a>            <span class="k">if</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_combinations-287"><a href="#CategoricalClassification.generate_combinations-287"><span class="linenos">287</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_combinations-288"><a href="#CategoricalClassification.generate_combinations-288"><span class="linenos">288</span></a>            <span class="k">elif</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_combinations-289"><a href="#CategoricalClassification.generate_combinations-289"><span class="linenos">289</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">))</span>
-</span><span id="CategoricalClassification.generate_combinations-290"><a href="#CategoricalClassification.generate_combinations-290"><span class="linenos">290</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_combinations-291"><a href="#CategoricalClassification.generate_combinations-291"><span class="linenos">291</span></a>            <span class="n">combination_type</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">combination_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_combinations-292"><a href="#CategoricalClassification.generate_combinations-292"><span class="linenos">292</span></a>
-</span><span id="CategoricalClassification.generate_combinations-293"><a href="#CategoricalClassification.generate_combinations-293"><span class="linenos">293</span></a>        <span class="n">combination_result</span> <span class="o">=</span> <span class="n">combination_function</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_combinations-285"><a href="#CategoricalClassification.generate_combinations-285"><span class="linenos">285</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_combinations-286"><a href="#CategoricalClassification.generate_combinations-286"><span class="linenos">286</span></a>
+</span><span id="CategoricalClassification.generate_combinations-287"><a href="#CategoricalClassification.generate_combinations-287"><span class="linenos">287</span></a>        <span class="k">if</span> <span class="n">combination_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_combinations-288"><a href="#CategoricalClassification.generate_combinations-288"><span class="linenos">288</span></a>            <span class="k">if</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_combinations-289"><a href="#CategoricalClassification.generate_combinations-289"><span class="linenos">289</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_combinations-290"><a href="#CategoricalClassification.generate_combinations-290"><span class="linenos">290</span></a>            <span class="k">elif</span> <span class="n">combination_type</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_combinations-291"><a href="#CategoricalClassification.generate_combinations-291"><span class="linenos">291</span></a>                <span class="n">combination_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_combinations-292"><a href="#CategoricalClassification.generate_combinations-292"><span class="linenos">292</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_combinations-293"><a href="#CategoricalClassification.generate_combinations-293"><span class="linenos">293</span></a>            <span class="n">combination_type</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">combination_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
 </span><span id="CategoricalClassification.generate_combinations-294"><a href="#CategoricalClassification.generate_combinations-294"><span class="linenos">294</span></a>
-</span><span id="CategoricalClassification.generate_combinations-295"><a href="#CategoricalClassification.generate_combinations-295"><span class="linenos">295</span></a>        <span class="n">combination_ix</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="CategoricalClassification.generate_combinations-295"><a href="#CategoricalClassification.generate_combinations-295"><span class="linenos">295</span></a>        <span class="n">combination_result</span> <span class="o">=</span> <span class="n">combination_function</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
 </span><span id="CategoricalClassification.generate_combinations-296"><a href="#CategoricalClassification.generate_combinations-296"><span class="linenos">296</span></a>
-</span><span id="CategoricalClassification.generate_combinations-297"><a href="#CategoricalClassification.generate_combinations-297"><span class="linenos">297</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="CategoricalClassification.generate_combinations-298"><a href="#CategoricalClassification.generate_combinations-298"><span class="linenos">298</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_combinations-299"><a href="#CategoricalClassification.generate_combinations-299"><span class="linenos">299</span></a>            <span class="s1">&#39;combination_type&#39;</span><span class="p">:</span> <span class="n">combination_type</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_combinations-300"><a href="#CategoricalClassification.generate_combinations-300"><span class="linenos">300</span></a>            <span class="s1">&#39;combination_ix&#39;</span><span class="p">:</span> <span class="n">combination_ix</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_combinations-301"><a href="#CategoricalClassification.generate_combinations-301"><span class="linenos">301</span></a>        <span class="p">})</span>
-</span><span id="CategoricalClassification.generate_combinations-302"><a href="#CategoricalClassification.generate_combinations-302"><span class="linenos">302</span></a>
-</span><span id="CategoricalClassification.generate_combinations-303"><a href="#CategoricalClassification.generate_combinations-303"><span class="linenos">303</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">combination_result</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_combinations-297"><a href="#CategoricalClassification.generate_combinations-297"><span class="linenos">297</span></a>        <span class="n">combination_ix</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="CategoricalClassification.generate_combinations-298"><a href="#CategoricalClassification.generate_combinations-298"><span class="linenos">298</span></a>
+</span><span id="CategoricalClassification.generate_combinations-299"><a href="#CategoricalClassification.generate_combinations-299"><span class="linenos">299</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="CategoricalClassification.generate_combinations-300"><a href="#CategoricalClassification.generate_combinations-300"><span class="linenos">300</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_combinations-301"><a href="#CategoricalClassification.generate_combinations-301"><span class="linenos">301</span></a>            <span class="s1">&#39;combination_type&#39;</span><span class="p">:</span> <span class="n">combination_type</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_combinations-302"><a href="#CategoricalClassification.generate_combinations-302"><span class="linenos">302</span></a>            <span class="s1">&#39;combination_ix&#39;</span><span class="p">:</span> <span class="n">combination_ix</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_combinations-303"><a href="#CategoricalClassification.generate_combinations-303"><span class="linenos">303</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification.generate_combinations-304"><a href="#CategoricalClassification.generate_combinations-304"><span class="linenos">304</span></a>
+</span><span id="CategoricalClassification.generate_combinations-305"><a href="#CategoricalClassification.generate_combinations-305"><span class="linenos">305</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">combination_result</span><span class="p">))</span>
 </span></pre></div>
 
 
@@ -2044,63 +2013,63 @@ <h6 id="returns">Returns</h6>
 
     </div>
     <a class="headerlink" href="#CategoricalClassification.generate_correlated"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_correlated-350"><a href="#CategoricalClassification.generate_correlated-350"><span class="linenos">350</span></a>    <span class="k">def</span> <span class="nf">generate_correlated</span><span class="p">(</span>
-</span><span id="CategoricalClassification.generate_correlated-351"><a href="#CategoricalClassification.generate_correlated-351"><span class="linenos">351</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_correlated-352"><a href="#CategoricalClassification.generate_correlated-352"><span class="linenos">352</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_correlated-353"><a href="#CategoricalClassification.generate_correlated-353"><span class="linenos">353</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_correlated-354"><a href="#CategoricalClassification.generate_correlated-354"><span class="linenos">354</span></a>        <span class="n">r</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.8</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_correlated-355"><a href="#CategoricalClassification.generate_correlated-355"><span class="linenos">355</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_correlated-356"><a href="#CategoricalClassification.generate_correlated-356"><span class="linenos">356</span></a>
-</span><span id="CategoricalClassification.generate_correlated-357"><a href="#CategoricalClassification.generate_correlated-357"><span class="linenos">357</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification.generate_correlated-358"><a href="#CategoricalClassification.generate_correlated-358"><span class="linenos">358</span></a><span class="sd">        Generates correlated features using the given feature indices. Correlation is based on cosine of angle between vectors with mean 0.</span>
-</span><span id="CategoricalClassification.generate_correlated-359"><a href="#CategoricalClassification.generate_correlated-359"><span class="linenos">359</span></a><span class="sd">        :param X: dataset</span>
-</span><span id="CategoricalClassification.generate_correlated-360"><a href="#CategoricalClassification.generate_correlated-360"><span class="linenos">360</span></a><span class="sd">        :param feature_indices: indices of features to generate correlated feature to</span>
-</span><span id="CategoricalClassification.generate_correlated-361"><a href="#CategoricalClassification.generate_correlated-361"><span class="linenos">361</span></a><span class="sd">        :param r: (Pearson) correlation factor</span>
-</span><span id="CategoricalClassification.generate_correlated-362"><a href="#CategoricalClassification.generate_correlated-362"><span class="linenos">362</span></a><span class="sd">        :return: X with generated correlated  features</span>
-</span><span id="CategoricalClassification.generate_correlated-363"><a href="#CategoricalClassification.generate_correlated-363"><span class="linenos">363</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification.generate_correlated-364"><a href="#CategoricalClassification.generate_correlated-364"><span class="linenos">364</span></a>
-</span><span id="CategoricalClassification.generate_correlated-365"><a href="#CategoricalClassification.generate_correlated-365"><span class="linenos">365</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="CategoricalClassification.generate_correlated-366"><a href="#CategoricalClassification.generate_correlated-366"><span class="linenos">366</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
-</span><span id="CategoricalClassification.generate_correlated-367"><a href="#CategoricalClassification.generate_correlated-367"><span class="linenos">367</span></a>
-</span><span id="CategoricalClassification.generate_correlated-368"><a href="#CategoricalClassification.generate_correlated-368"><span class="linenos">368</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_correlated-369"><a href="#CategoricalClassification.generate_correlated-369"><span class="linenos">369</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)),</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_correlated-370"><a href="#CategoricalClassification.generate_correlated-370"><span class="linenos">370</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_correlated-371"><a href="#CategoricalClassification.generate_correlated-371"><span class="linenos">371</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
-</span><span id="CategoricalClassification.generate_correlated-372"><a href="#CategoricalClassification.generate_correlated-372"><span class="linenos">372</span></a>
-</span><span id="CategoricalClassification.generate_correlated-373"><a href="#CategoricalClassification.generate_correlated-373"><span class="linenos">373</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
-</span><span id="CategoricalClassification.generate_correlated-374"><a href="#CategoricalClassification.generate_correlated-374"><span class="linenos">374</span></a>        <span class="n">transposed</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_correlated-375"><a href="#CategoricalClassification.generate_correlated-375"><span class="linenos">375</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="CategoricalClassification.generate_correlated-376"><a href="#CategoricalClassification.generate_correlated-376"><span class="linenos">376</span></a>
-</span><span id="CategoricalClassification.generate_correlated-377"><a href="#CategoricalClassification.generate_correlated-377"><span class="linenos">377</span></a>        <span class="k">for</span> <span class="n">t</span> <span class="ow">in</span> <span class="n">transposed</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_correlated-378"><a href="#CategoricalClassification.generate_correlated-378"><span class="linenos">378</span></a>            <span class="n">theta</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arccos</span><span class="p">(</span><span class="n">r</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_correlated-379"><a href="#CategoricalClassification.generate_correlated-379"><span class="linenos">379</span></a>            <span class="n">t_standard</span> <span class="o">=</span> <span class="p">(</span><span class="n">t</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">t</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">t</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_correlated-380"><a href="#CategoricalClassification.generate_correlated-380"><span class="linenos">380</span></a>
-</span><span id="CategoricalClassification.generate_correlated-381"><a href="#CategoricalClassification.generate_correlated-381"><span class="linenos">381</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">normal</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">t_standard</span><span class="p">))</span>
-</span><span id="CategoricalClassification.generate_correlated-382"><a href="#CategoricalClassification.generate_correlated-382"><span class="linenos">382</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="p">(</span><span class="n">rand</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">rand</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">rand</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_correlated-383"><a href="#CategoricalClassification.generate_correlated-383"><span class="linenos">383</span></a>
-</span><span id="CategoricalClassification.generate_correlated-384"><a href="#CategoricalClassification.generate_correlated-384"><span class="linenos">384</span></a>            <span class="n">M</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">t_standard</span><span class="p">,</span> <span class="n">rand</span><span class="p">))</span>
-</span><span id="CategoricalClassification.generate_correlated-385"><a href="#CategoricalClassification.generate_correlated-385"><span class="linenos">385</span></a>            <span class="n">M_centred</span> <span class="o">=</span> <span class="p">(</span><span class="n">M</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">M</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))</span>
-</span><span id="CategoricalClassification.generate_correlated-386"><a href="#CategoricalClassification.generate_correlated-386"><span class="linenos">386</span></a>
-</span><span id="CategoricalClassification.generate_correlated-387"><a href="#CategoricalClassification.generate_correlated-387"><span class="linenos">387</span></a>            <span class="n">Id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">eye</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">t</span><span class="p">))</span>
-</span><span id="CategoricalClassification.generate_correlated-388"><a href="#CategoricalClassification.generate_correlated-388"><span class="linenos">388</span></a>            <span class="n">Q</span> <span class="o">=</span> <span class="n">qr</span><span class="p">(</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="p">[</span><span class="mi">0</span><span class="p">]],</span> <span class="n">mode</span><span class="o">=</span><span class="s1">&#39;economic&#39;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="CategoricalClassification.generate_correlated-389"><a href="#CategoricalClassification.generate_correlated-389"><span class="linenos">389</span></a>            <span class="n">P</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Q</span><span class="p">,</span> <span class="n">Q</span><span class="o">.</span><span class="n">T</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_correlated-390"><a href="#CategoricalClassification.generate_correlated-390"><span class="linenos">390</span></a>            <span class="n">orthogonal_projection</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Id</span> <span class="o">-</span> <span class="n">P</span><span class="p">,</span> <span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">])</span>
-</span><span id="CategoricalClassification.generate_correlated-391"><a href="#CategoricalClassification.generate_correlated-391"><span class="linenos">391</span></a>            <span class="n">M_orthogonal</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">],</span> <span class="n">orthogonal_projection</span><span class="p">))</span>
-</span><span id="CategoricalClassification.generate_correlated-392"><a href="#CategoricalClassification.generate_correlated-392"><span class="linenos">392</span></a>
-</span><span id="CategoricalClassification.generate_correlated-393"><a href="#CategoricalClassification.generate_correlated-393"><span class="linenos">393</span></a>            <span class="n">Y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">M_orthogonal</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">M_orthogonal</span> <span class="o">**</span> <span class="mi">2</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))))</span>
-</span><span id="CategoricalClassification.generate_correlated-394"><a href="#CategoricalClassification.generate_correlated-394"><span class="linenos">394</span></a>            <span class="n">corr</span> <span class="o">=</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">tan</span><span class="p">(</span><span class="n">theta</span><span class="p">))</span> <span class="o">*</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">]</span>
-</span><span id="CategoricalClassification.generate_correlated-395"><a href="#CategoricalClassification.generate_correlated-395"><span class="linenos">395</span></a>
-</span><span id="CategoricalClassification.generate_correlated-396"><a href="#CategoricalClassification.generate_correlated-396"><span class="linenos">396</span></a>            <span class="n">correlated_features</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">corr</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_correlated-352"><a href="#CategoricalClassification.generate_correlated-352"><span class="linenos">352</span></a>    <span class="k">def</span> <span class="nf">generate_correlated</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_correlated-353"><a href="#CategoricalClassification.generate_correlated-353"><span class="linenos">353</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_correlated-354"><a href="#CategoricalClassification.generate_correlated-354"><span class="linenos">354</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_correlated-355"><a href="#CategoricalClassification.generate_correlated-355"><span class="linenos">355</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_correlated-356"><a href="#CategoricalClassification.generate_correlated-356"><span class="linenos">356</span></a>        <span class="n">r</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.8</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_correlated-357"><a href="#CategoricalClassification.generate_correlated-357"><span class="linenos">357</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_correlated-358"><a href="#CategoricalClassification.generate_correlated-358"><span class="linenos">358</span></a>
+</span><span id="CategoricalClassification.generate_correlated-359"><a href="#CategoricalClassification.generate_correlated-359"><span class="linenos">359</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_correlated-360"><a href="#CategoricalClassification.generate_correlated-360"><span class="linenos">360</span></a><span class="sd">        Generates correlated features using the given feature indices. Correlation is based on cosine of angle between vectors with mean 0.</span>
+</span><span id="CategoricalClassification.generate_correlated-361"><a href="#CategoricalClassification.generate_correlated-361"><span class="linenos">361</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification.generate_correlated-362"><a href="#CategoricalClassification.generate_correlated-362"><span class="linenos">362</span></a><span class="sd">        :param feature_indices: indices of features to generate correlated feature to</span>
+</span><span id="CategoricalClassification.generate_correlated-363"><a href="#CategoricalClassification.generate_correlated-363"><span class="linenos">363</span></a><span class="sd">        :param r: (Pearson) correlation factor</span>
+</span><span id="CategoricalClassification.generate_correlated-364"><a href="#CategoricalClassification.generate_correlated-364"><span class="linenos">364</span></a><span class="sd">        :return: X with generated correlated  features</span>
+</span><span id="CategoricalClassification.generate_correlated-365"><a href="#CategoricalClassification.generate_correlated-365"><span class="linenos">365</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_correlated-366"><a href="#CategoricalClassification.generate_correlated-366"><span class="linenos">366</span></a>
+</span><span id="CategoricalClassification.generate_correlated-367"><a href="#CategoricalClassification.generate_correlated-367"><span class="linenos">367</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification.generate_correlated-368"><a href="#CategoricalClassification.generate_correlated-368"><span class="linenos">368</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
+</span><span id="CategoricalClassification.generate_correlated-369"><a href="#CategoricalClassification.generate_correlated-369"><span class="linenos">369</span></a>
+</span><span id="CategoricalClassification.generate_correlated-370"><a href="#CategoricalClassification.generate_correlated-370"><span class="linenos">370</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_correlated-371"><a href="#CategoricalClassification.generate_correlated-371"><span class="linenos">371</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)),</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_correlated-372"><a href="#CategoricalClassification.generate_correlated-372"><span class="linenos">372</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_correlated-373"><a href="#CategoricalClassification.generate_correlated-373"><span class="linenos">373</span></a>            <span class="n">correlated_ixs</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="CategoricalClassification.generate_correlated-374"><a href="#CategoricalClassification.generate_correlated-374"><span class="linenos">374</span></a>
+</span><span id="CategoricalClassification.generate_correlated-375"><a href="#CategoricalClassification.generate_correlated-375"><span class="linenos">375</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_correlated-376"><a href="#CategoricalClassification.generate_correlated-376"><span class="linenos">376</span></a>        <span class="n">transposed</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">selected_features</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_correlated-377"><a href="#CategoricalClassification.generate_correlated-377"><span class="linenos">377</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification.generate_correlated-378"><a href="#CategoricalClassification.generate_correlated-378"><span class="linenos">378</span></a>
+</span><span id="CategoricalClassification.generate_correlated-379"><a href="#CategoricalClassification.generate_correlated-379"><span class="linenos">379</span></a>        <span class="k">for</span> <span class="n">t</span> <span class="ow">in</span> <span class="n">transposed</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_correlated-380"><a href="#CategoricalClassification.generate_correlated-380"><span class="linenos">380</span></a>            <span class="n">theta</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arccos</span><span class="p">(</span><span class="n">r</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_correlated-381"><a href="#CategoricalClassification.generate_correlated-381"><span class="linenos">381</span></a>            <span class="n">t_standard</span> <span class="o">=</span> <span class="p">(</span><span class="n">t</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">t</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">t</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_correlated-382"><a href="#CategoricalClassification.generate_correlated-382"><span class="linenos">382</span></a>
+</span><span id="CategoricalClassification.generate_correlated-383"><a href="#CategoricalClassification.generate_correlated-383"><span class="linenos">383</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">normal</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">t_standard</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_correlated-384"><a href="#CategoricalClassification.generate_correlated-384"><span class="linenos">384</span></a>            <span class="n">rand</span> <span class="o">=</span> <span class="p">(</span><span class="n">rand</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">rand</span><span class="p">))</span> <span class="o">/</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">rand</span><span class="p">)</span> <span class="o">+</span> <span class="mf">1e-10</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_correlated-385"><a href="#CategoricalClassification.generate_correlated-385"><span class="linenos">385</span></a>
+</span><span id="CategoricalClassification.generate_correlated-386"><a href="#CategoricalClassification.generate_correlated-386"><span class="linenos">386</span></a>            <span class="n">M</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">t_standard</span><span class="p">,</span> <span class="n">rand</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_correlated-387"><a href="#CategoricalClassification.generate_correlated-387"><span class="linenos">387</span></a>            <span class="n">M_centred</span> <span class="o">=</span> <span class="p">(</span><span class="n">M</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">M</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_correlated-388"><a href="#CategoricalClassification.generate_correlated-388"><span class="linenos">388</span></a>
+</span><span id="CategoricalClassification.generate_correlated-389"><a href="#CategoricalClassification.generate_correlated-389"><span class="linenos">389</span></a>            <span class="n">Id</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">eye</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">t</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_correlated-390"><a href="#CategoricalClassification.generate_correlated-390"><span class="linenos">390</span></a>            <span class="n">Q</span> <span class="o">=</span> <span class="n">qr</span><span class="p">(</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="p">[</span><span class="mi">0</span><span class="p">]],</span> <span class="n">mode</span><span class="o">=</span><span class="s1">&#39;economic&#39;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_correlated-391"><a href="#CategoricalClassification.generate_correlated-391"><span class="linenos">391</span></a>            <span class="n">P</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Q</span><span class="p">,</span> <span class="n">Q</span><span class="o">.</span><span class="n">T</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_correlated-392"><a href="#CategoricalClassification.generate_correlated-392"><span class="linenos">392</span></a>            <span class="n">orthogonal_projection</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Id</span> <span class="o">-</span> <span class="n">P</span><span class="p">,</span> <span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">])</span>
+</span><span id="CategoricalClassification.generate_correlated-393"><a href="#CategoricalClassification.generate_correlated-393"><span class="linenos">393</span></a>            <span class="n">M_orthogonal</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">M_centred</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">],</span> <span class="n">orthogonal_projection</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_correlated-394"><a href="#CategoricalClassification.generate_correlated-394"><span class="linenos">394</span></a>
+</span><span id="CategoricalClassification.generate_correlated-395"><a href="#CategoricalClassification.generate_correlated-395"><span class="linenos">395</span></a>            <span class="n">Y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">M_orthogonal</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">diag</span><span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">M_orthogonal</span> <span class="o">**</span> <span class="mi">2</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))))</span>
+</span><span id="CategoricalClassification.generate_correlated-396"><a href="#CategoricalClassification.generate_correlated-396"><span class="linenos">396</span></a>            <span class="n">corr</span> <span class="o">=</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">tan</span><span class="p">(</span><span class="n">theta</span><span class="p">))</span> <span class="o">*</span> <span class="n">Y</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">]</span>
 </span><span id="CategoricalClassification.generate_correlated-397"><a href="#CategoricalClassification.generate_correlated-397"><span class="linenos">397</span></a>
-</span><span id="CategoricalClassification.generate_correlated-398"><a href="#CategoricalClassification.generate_correlated-398"><span class="linenos">398</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">correlated_features</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_correlated-398"><a href="#CategoricalClassification.generate_correlated-398"><span class="linenos">398</span></a>            <span class="n">correlated_features</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">corr</span><span class="p">)</span>
 </span><span id="CategoricalClassification.generate_correlated-399"><a href="#CategoricalClassification.generate_correlated-399"><span class="linenos">399</span></a>
-</span><span id="CategoricalClassification.generate_correlated-400"><a href="#CategoricalClassification.generate_correlated-400"><span class="linenos">400</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="CategoricalClassification.generate_correlated-401"><a href="#CategoricalClassification.generate_correlated-401"><span class="linenos">401</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_correlated-402"><a href="#CategoricalClassification.generate_correlated-402"><span class="linenos">402</span></a>            <span class="s1">&#39;correlated_indices&#39;</span><span class="p">:</span> <span class="n">correlated_ixs</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_correlated-403"><a href="#CategoricalClassification.generate_correlated-403"><span class="linenos">403</span></a>            <span class="s1">&#39;correlation_factor&#39;</span><span class="p">:</span> <span class="n">r</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_correlated-404"><a href="#CategoricalClassification.generate_correlated-404"><span class="linenos">404</span></a>        <span class="p">})</span>
-</span><span id="CategoricalClassification.generate_correlated-405"><a href="#CategoricalClassification.generate_correlated-405"><span class="linenos">405</span></a>
-</span><span id="CategoricalClassification.generate_correlated-406"><a href="#CategoricalClassification.generate_correlated-406"><span class="linenos">406</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">correlated_features</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_correlated-400"><a href="#CategoricalClassification.generate_correlated-400"><span class="linenos">400</span></a>        <span class="n">correlated_features</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="n">correlated_features</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_correlated-401"><a href="#CategoricalClassification.generate_correlated-401"><span class="linenos">401</span></a>
+</span><span id="CategoricalClassification.generate_correlated-402"><a href="#CategoricalClassification.generate_correlated-402"><span class="linenos">402</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="CategoricalClassification.generate_correlated-403"><a href="#CategoricalClassification.generate_correlated-403"><span class="linenos">403</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_correlated-404"><a href="#CategoricalClassification.generate_correlated-404"><span class="linenos">404</span></a>            <span class="s1">&#39;correlated_indices&#39;</span><span class="p">:</span> <span class="n">correlated_ixs</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_correlated-405"><a href="#CategoricalClassification.generate_correlated-405"><span class="linenos">405</span></a>            <span class="s1">&#39;correlation_factor&#39;</span><span class="p">:</span> <span class="n">r</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_correlated-406"><a href="#CategoricalClassification.generate_correlated-406"><span class="linenos">406</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification.generate_correlated-407"><a href="#CategoricalClassification.generate_correlated-407"><span class="linenos">407</span></a>
+</span><span id="CategoricalClassification.generate_correlated-408"><a href="#CategoricalClassification.generate_correlated-408"><span class="linenos">408</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">correlated_features</span><span class="p">))</span>
 </span></pre></div>
 
 
@@ -2134,30 +2103,30 @@ <h6 id="returns">Returns</h6>
 
     </div>
     <a class="headerlink" href="#CategoricalClassification.generate_duplicates"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_duplicates-408"><a href="#CategoricalClassification.generate_duplicates-408"><span class="linenos">408</span></a>    <span class="k">def</span> <span class="nf">generate_duplicates</span><span class="p">(</span>
-</span><span id="CategoricalClassification.generate_duplicates-409"><a href="#CategoricalClassification.generate_duplicates-409"><span class="linenos">409</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_duplicates-410"><a href="#CategoricalClassification.generate_duplicates-410"><span class="linenos">410</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_duplicates-411"><a href="#CategoricalClassification.generate_duplicates-411"><span class="linenos">411</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_duplicates-412"><a href="#CategoricalClassification.generate_duplicates-412"><span class="linenos">412</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_duplicates-413"><a href="#CategoricalClassification.generate_duplicates-413"><span class="linenos">413</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification.generate_duplicates-414"><a href="#CategoricalClassification.generate_duplicates-414"><span class="linenos">414</span></a><span class="sd">        Generates duplicate features</span>
-</span><span id="CategoricalClassification.generate_duplicates-415"><a href="#CategoricalClassification.generate_duplicates-415"><span class="linenos">415</span></a><span class="sd">        :param X: dataset</span>
-</span><span id="CategoricalClassification.generate_duplicates-416"><a href="#CategoricalClassification.generate_duplicates-416"><span class="linenos">416</span></a><span class="sd">        :param feature_indices: indices of features to duplicate</span>
-</span><span id="CategoricalClassification.generate_duplicates-417"><a href="#CategoricalClassification.generate_duplicates-417"><span class="linenos">417</span></a><span class="sd">        :return: dataset with duplicated features</span>
-</span><span id="CategoricalClassification.generate_duplicates-418"><a href="#CategoricalClassification.generate_duplicates-418"><span class="linenos">418</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification.generate_duplicates-419"><a href="#CategoricalClassification.generate_duplicates-419"><span class="linenos">419</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="CategoricalClassification.generate_duplicates-420"><a href="#CategoricalClassification.generate_duplicates-420"><span class="linenos">420</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
-</span><span id="CategoricalClassification.generate_duplicates-421"><a href="#CategoricalClassification.generate_duplicates-421"><span class="linenos">421</span></a>
-</span><span id="CategoricalClassification.generate_duplicates-422"><a href="#CategoricalClassification.generate_duplicates-422"><span class="linenos">422</span></a>        <span class="n">duplicated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">),</span> <span class="mi">1</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_duplicates-410"><a href="#CategoricalClassification.generate_duplicates-410"><span class="linenos">410</span></a>    <span class="k">def</span> <span class="nf">generate_duplicates</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_duplicates-411"><a href="#CategoricalClassification.generate_duplicates-411"><span class="linenos">411</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_duplicates-412"><a href="#CategoricalClassification.generate_duplicates-412"><span class="linenos">412</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_duplicates-413"><a href="#CategoricalClassification.generate_duplicates-413"><span class="linenos">413</span></a>        <span class="n">feature_indices</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_duplicates-414"><a href="#CategoricalClassification.generate_duplicates-414"><span class="linenos">414</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_duplicates-415"><a href="#CategoricalClassification.generate_duplicates-415"><span class="linenos">415</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_duplicates-416"><a href="#CategoricalClassification.generate_duplicates-416"><span class="linenos">416</span></a><span class="sd">        Generates duplicate features</span>
+</span><span id="CategoricalClassification.generate_duplicates-417"><a href="#CategoricalClassification.generate_duplicates-417"><span class="linenos">417</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification.generate_duplicates-418"><a href="#CategoricalClassification.generate_duplicates-418"><span class="linenos">418</span></a><span class="sd">        :param feature_indices: indices of features to duplicate</span>
+</span><span id="CategoricalClassification.generate_duplicates-419"><a href="#CategoricalClassification.generate_duplicates-419"><span class="linenos">419</span></a><span class="sd">        :return: dataset with duplicated features</span>
+</span><span id="CategoricalClassification.generate_duplicates-420"><a href="#CategoricalClassification.generate_duplicates-420"><span class="linenos">420</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_duplicates-421"><a href="#CategoricalClassification.generate_duplicates-421"><span class="linenos">421</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification.generate_duplicates-422"><a href="#CategoricalClassification.generate_duplicates-422"><span class="linenos">422</span></a>            <span class="n">feature_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">feature_indices</span><span class="p">])</span>
 </span><span id="CategoricalClassification.generate_duplicates-423"><a href="#CategoricalClassification.generate_duplicates-423"><span class="linenos">423</span></a>
-</span><span id="CategoricalClassification.generate_duplicates-424"><a href="#CategoricalClassification.generate_duplicates-424"><span class="linenos">424</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_duplicates-424"><a href="#CategoricalClassification.generate_duplicates-424"><span class="linenos">424</span></a>        <span class="n">duplicated_ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">feature_indices</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">),</span> <span class="mi">1</span><span class="p">)</span>
 </span><span id="CategoricalClassification.generate_duplicates-425"><a href="#CategoricalClassification.generate_duplicates-425"><span class="linenos">425</span></a>
-</span><span id="CategoricalClassification.generate_duplicates-426"><a href="#CategoricalClassification.generate_duplicates-426"><span class="linenos">426</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="CategoricalClassification.generate_duplicates-427"><a href="#CategoricalClassification.generate_duplicates-427"><span class="linenos">427</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_duplicates-428"><a href="#CategoricalClassification.generate_duplicates-428"><span class="linenos">428</span></a>            <span class="s1">&#39;duplicate_indices&#39;</span><span class="p">:</span> <span class="n">duplicated_ixs</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_duplicates-429"><a href="#CategoricalClassification.generate_duplicates-429"><span class="linenos">429</span></a>        <span class="p">})</span>
-</span><span id="CategoricalClassification.generate_duplicates-430"><a href="#CategoricalClassification.generate_duplicates-430"><span class="linenos">430</span></a>
-</span><span id="CategoricalClassification.generate_duplicates-431"><a href="#CategoricalClassification.generate_duplicates-431"><span class="linenos">431</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">selected_features</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_duplicates-426"><a href="#CategoricalClassification.generate_duplicates-426"><span class="linenos">426</span></a>        <span class="n">selected_features</span> <span class="o">=</span> <span class="n">X</span><span class="p">[:,</span> <span class="n">feature_indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_duplicates-427"><a href="#CategoricalClassification.generate_duplicates-427"><span class="linenos">427</span></a>
+</span><span id="CategoricalClassification.generate_duplicates-428"><a href="#CategoricalClassification.generate_duplicates-428"><span class="linenos">428</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="CategoricalClassification.generate_duplicates-429"><a href="#CategoricalClassification.generate_duplicates-429"><span class="linenos">429</span></a>            <span class="s1">&#39;feature_indices&#39;</span><span class="p">:</span> <span class="n">feature_indices</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_duplicates-430"><a href="#CategoricalClassification.generate_duplicates-430"><span class="linenos">430</span></a>            <span class="s1">&#39;duplicate_indices&#39;</span><span class="p">:</span> <span class="n">duplicated_ixs</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_duplicates-431"><a href="#CategoricalClassification.generate_duplicates-431"><span class="linenos">431</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification.generate_duplicates-432"><a href="#CategoricalClassification.generate_duplicates-432"><span class="linenos">432</span></a>
+</span><span id="CategoricalClassification.generate_duplicates-433"><a href="#CategoricalClassification.generate_duplicates-433"><span class="linenos">433</span></a>        <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">column_stack</span><span class="p">((</span><span class="n">X</span><span class="p">,</span> <span class="n">selected_features</span><span class="p">))</span>
 </span></pre></div>
 
 
@@ -2184,106 +2153,108 @@ <h6 id="returns">Returns</h6>
 <div class="attr function">
             
         <span class="def">def</span>
-        <span class="name">generate_labels</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">X</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">2</span>,</span><span class="param">	<span class="n">p</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span> <span class="o">=</span> <span class="mf">0.5</span>,</span><span class="param">	<span class="n">k</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">2</span>,</span><span class="param">	<span class="n">decision_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">class_relation</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span>,</span><span class="param">	<span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span></span><span class="return-annotation">):</span></span>
+        <span class="name">generate_labels</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">X</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">2</span>,</span><span class="param">	<span class="n">p</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span> <span class="o">=</span> <span class="mf">0.5</span>,</span><span class="param">	<span class="n">k</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">2</span>,</span><span class="param">	<span class="n">decision_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">class_relation</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;linear&#39;</span><span class="p">,</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">,</span> <span class="s1">&#39;cluster&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span>,</span><span class="param">	<span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span>,</span><span class="param">	<span class="n">random_state</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span></span><span class="return-annotation">):</span></span>
 
                 <label class="view-source-button" for="CategoricalClassification.generate_labels-view-source"><span>View Source</span></label>
 
     </div>
     <a class="headerlink" href="#CategoricalClassification.generate_labels"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_labels-433"><a href="#CategoricalClassification.generate_labels-433"><span class="linenos">433</span></a>    <span class="k">def</span> <span class="nf">generate_labels</span><span class="p">(</span>
-</span><span id="CategoricalClassification.generate_labels-434"><a href="#CategoricalClassification.generate_labels-434"><span class="linenos">434</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_labels-435"><a href="#CategoricalClassification.generate_labels-435"><span class="linenos">435</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_labels-436"><a href="#CategoricalClassification.generate_labels-436"><span class="linenos">436</span></a>        <span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_labels-437"><a href="#CategoricalClassification.generate_labels-437"><span class="linenos">437</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">|</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">=</span> <span class="mf">0.5</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_labels-438"><a href="#CategoricalClassification.generate_labels-438"><span class="linenos">438</span></a>        <span class="n">k</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_labels-439"><a href="#CategoricalClassification.generate_labels-439"><span class="linenos">439</span></a>        <span class="n">decision_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_labels-440"><a href="#CategoricalClassification.generate_labels-440"><span class="linenos">440</span></a>        <span class="n">class_relation</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_labels-441"><a href="#CategoricalClassification.generate_labels-441"><span class="linenos">441</span></a>        <span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_labels-442"><a href="#CategoricalClassification.generate_labels-442"><span class="linenos">442</span></a>    <span class="p">):</span>
-</span><span id="CategoricalClassification.generate_labels-443"><a href="#CategoricalClassification.generate_labels-443"><span class="linenos">443</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification.generate_labels-444"><a href="#CategoricalClassification.generate_labels-444"><span class="linenos">444</span></a><span class="sd">        Generates labels for dataset X</span>
-</span><span id="CategoricalClassification.generate_labels-445"><a href="#CategoricalClassification.generate_labels-445"><span class="linenos">445</span></a><span class="sd">        :param X: dataset</span>
-</span><span id="CategoricalClassification.generate_labels-446"><a href="#CategoricalClassification.generate_labels-446"><span class="linenos">446</span></a><span class="sd">        :param n: number of class labels</span>
-</span><span id="CategoricalClassification.generate_labels-447"><a href="#CategoricalClassification.generate_labels-447"><span class="linenos">447</span></a><span class="sd">        :param p: class distribution</span>
-</span><span id="CategoricalClassification.generate_labels-448"><a href="#CategoricalClassification.generate_labels-448"><span class="linenos">448</span></a><span class="sd">        :param k: constant</span>
-</span><span id="CategoricalClassification.generate_labels-449"><a href="#CategoricalClassification.generate_labels-449"><span class="linenos">449</span></a><span class="sd">        :param decision_function: optional user-defined decision function</span>
-</span><span id="CategoricalClassification.generate_labels-450"><a href="#CategoricalClassification.generate_labels-450"><span class="linenos">450</span></a><span class="sd">        :param class_relation: string, either &#39;linear&#39;, &#39;nonlinear&#39;, or &#39;cluster&#39;</span>
-</span><span id="CategoricalClassification.generate_labels-451"><a href="#CategoricalClassification.generate_labels-451"><span class="linenos">451</span></a><span class="sd">        :param balance: boolean, whether to balance clustering class labels</span>
-</span><span id="CategoricalClassification.generate_labels-452"><a href="#CategoricalClassification.generate_labels-452"><span class="linenos">452</span></a><span class="sd">        :return: array of labels, corresponding to dataset X</span>
-</span><span id="CategoricalClassification.generate_labels-453"><a href="#CategoricalClassification.generate_labels-453"><span class="linenos">453</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification.generate_labels-454"><a href="#CategoricalClassification.generate_labels-454"><span class="linenos">454</span></a>
-</span><span id="CategoricalClassification.generate_labels-455"><a href="#CategoricalClassification.generate_labels-455"><span class="linenos">455</span></a>        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-</span><span id="CategoricalClassification.generate_labels-456"><a href="#CategoricalClassification.generate_labels-456"><span class="linenos">456</span></a>            <span class="k">if</span> <span class="nb">sum</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;sum of values in must be less than 1.0&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-457"><a href="#CategoricalClassification.generate_labels-457"><span class="linenos">457</span></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">n</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;length of p must equal n&#39;</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_labels-435"><a href="#CategoricalClassification.generate_labels-435"><span class="linenos">435</span></a>    <span class="k">def</span> <span class="nf">generate_labels</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_labels-436"><a href="#CategoricalClassification.generate_labels-436"><span class="linenos">436</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-437"><a href="#CategoricalClassification.generate_labels-437"><span class="linenos">437</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-438"><a href="#CategoricalClassification.generate_labels-438"><span class="linenos">438</span></a>        <span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-439"><a href="#CategoricalClassification.generate_labels-439"><span class="linenos">439</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">|</span> <span class="nb">list</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span> <span class="o">=</span> <span class="mf">0.5</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-440"><a href="#CategoricalClassification.generate_labels-440"><span class="linenos">440</span></a>        <span class="n">k</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-441"><a href="#CategoricalClassification.generate_labels-441"><span class="linenos">441</span></a>        <span class="n">decision_function</span><span class="p">:</span> <span class="n">Optional</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-442"><a href="#CategoricalClassification.generate_labels-442"><span class="linenos">442</span></a>        <span class="n">class_relation</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;linear&#39;</span><span class="p">,</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">,</span> <span class="s1">&#39;cluster&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;linear&#39;</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-443"><a href="#CategoricalClassification.generate_labels-443"><span class="linenos">443</span></a>        <span class="n">balance</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-444"><a href="#CategoricalClassification.generate_labels-444"><span class="linenos">444</span></a>        <span class="n">random_state</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-445"><a href="#CategoricalClassification.generate_labels-445"><span class="linenos">445</span></a>    <span class="p">):</span>
+</span><span id="CategoricalClassification.generate_labels-446"><a href="#CategoricalClassification.generate_labels-446"><span class="linenos">446</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_labels-447"><a href="#CategoricalClassification.generate_labels-447"><span class="linenos">447</span></a><span class="sd">        Generates labels for dataset X</span>
+</span><span id="CategoricalClassification.generate_labels-448"><a href="#CategoricalClassification.generate_labels-448"><span class="linenos">448</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification.generate_labels-449"><a href="#CategoricalClassification.generate_labels-449"><span class="linenos">449</span></a><span class="sd">        :param n: number of class labels</span>
+</span><span id="CategoricalClassification.generate_labels-450"><a href="#CategoricalClassification.generate_labels-450"><span class="linenos">450</span></a><span class="sd">        :param p: class distribution</span>
+</span><span id="CategoricalClassification.generate_labels-451"><a href="#CategoricalClassification.generate_labels-451"><span class="linenos">451</span></a><span class="sd">        :param k: constant</span>
+</span><span id="CategoricalClassification.generate_labels-452"><a href="#CategoricalClassification.generate_labels-452"><span class="linenos">452</span></a><span class="sd">        :param decision_function: optional user-defined decision function</span>
+</span><span id="CategoricalClassification.generate_labels-453"><a href="#CategoricalClassification.generate_labels-453"><span class="linenos">453</span></a><span class="sd">        :param class_relation: string, either &#39;linear&#39;, &#39;nonlinear&#39;, or &#39;cluster&#39;</span>
+</span><span id="CategoricalClassification.generate_labels-454"><a href="#CategoricalClassification.generate_labels-454"><span class="linenos">454</span></a><span class="sd">        :param balance: boolean, whether to balance clustering class labels</span>
+</span><span id="CategoricalClassification.generate_labels-455"><a href="#CategoricalClassification.generate_labels-455"><span class="linenos">455</span></a><span class="sd">        :param random_state: seed for KMeans clustering, defaults to 42</span>
+</span><span id="CategoricalClassification.generate_labels-456"><a href="#CategoricalClassification.generate_labels-456"><span class="linenos">456</span></a><span class="sd">        :return: array of labels, corresponding to dataset X</span>
+</span><span id="CategoricalClassification.generate_labels-457"><a href="#CategoricalClassification.generate_labels-457"><span class="linenos">457</span></a><span class="sd">        &quot;&quot;&quot;</span>
 </span><span id="CategoricalClassification.generate_labels-458"><a href="#CategoricalClassification.generate_labels-458"><span class="linenos">458</span></a>
-</span><span id="CategoricalClassification.generate_labels-459"><a href="#CategoricalClassification.generate_labels-459"><span class="linenos">459</span></a>        <span class="k">if</span> <span class="n">p</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;p must be less than 1.0&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-460"><a href="#CategoricalClassification.generate_labels-460"><span class="linenos">460</span></a>
-</span><span id="CategoricalClassification.generate_labels-461"><a href="#CategoricalClassification.generate_labels-461"><span class="linenos">461</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification.generate_labels-459"><a href="#CategoricalClassification.generate_labels-459"><span class="linenos">459</span></a>        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">p</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
+</span><span id="CategoricalClassification.generate_labels-460"><a href="#CategoricalClassification.generate_labels-460"><span class="linenos">460</span></a>            <span class="k">if</span> <span class="nb">sum</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;sum of values in must be less than 1.0&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-461"><a href="#CategoricalClassification.generate_labels-461"><span class="linenos">461</span></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">n</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;length of p must equal n&#39;</span><span class="p">)</span>
 </span><span id="CategoricalClassification.generate_labels-462"><a href="#CategoricalClassification.generate_labels-462"><span class="linenos">462</span></a>
-</span><span id="CategoricalClassification.generate_labels-463"><a href="#CategoricalClassification.generate_labels-463"><span class="linenos">463</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_labels-464"><a href="#CategoricalClassification.generate_labels-464"><span class="linenos">464</span></a>            <span class="k">if</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_labels-465"><a href="#CategoricalClassification.generate_labels-465"><span class="linenos">465</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="n">x</span> <span class="o">+</span> <span class="mi">3</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-466"><a href="#CategoricalClassification.generate_labels-466"><span class="linenos">466</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_labels-467"><a href="#CategoricalClassification.generate_labels-467"><span class="linenos">467</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="o">+</span> <span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">cos</span><span class="p">(</span><span class="n">x</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-468"><a href="#CategoricalClassification.generate_labels-468"><span class="linenos">468</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;cluster&#39;</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_labels-469"><a href="#CategoricalClassification.generate_labels-469"><span class="linenos">469</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="CategoricalClassification.generate_labels-470"><a href="#CategoricalClassification.generate_labels-470"><span class="linenos">470</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_labels-471"><a href="#CategoricalClassification.generate_labels-471"><span class="linenos">471</span></a>            <span class="n">class_relation</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">decision_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-472"><a href="#CategoricalClassification.generate_labels-472"><span class="linenos">472</span></a>
-</span><span id="CategoricalClassification.generate_labels-473"><a href="#CategoricalClassification.generate_labels-473"><span class="linenos">473</span></a>        <span class="n">y</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="CategoricalClassification.generate_labels-474"><a href="#CategoricalClassification.generate_labels-474"><span class="linenos">474</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_labels-475"><a href="#CategoricalClassification.generate_labels-475"><span class="linenos">475</span></a>            <span class="k">if</span> <span class="n">n</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_labels-476"><a href="#CategoricalClassification.generate_labels-476"><span class="linenos">476</span></a>                <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">list</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_labels-477"><a href="#CategoricalClassification.generate_labels-477"><span class="linenos">477</span></a>                    <span class="n">p</span> <span class="o">=</span> <span class="mi">1</span> <span class="o">/</span> <span class="n">n</span>
-</span><span id="CategoricalClassification.generate_labels-478"><a href="#CategoricalClassification.generate_labels-478"><span class="linenos">478</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">]</span>
-</span><span id="CategoricalClassification.generate_labels-479"><a href="#CategoricalClassification.generate_labels-479"><span class="linenos">479</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
-</span><span id="CategoricalClassification.generate_labels-480"><a href="#CategoricalClassification.generate_labels-480"><span class="linenos">480</span></a>                        <span class="n">percentiles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">))</span>
-</span><span id="CategoricalClassification.generate_labels-481"><a href="#CategoricalClassification.generate_labels-481"><span class="linenos">481</span></a>
-</span><span id="CategoricalClassification.generate_labels-482"><a href="#CategoricalClassification.generate_labels-482"><span class="linenos">482</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-483"><a href="#CategoricalClassification.generate_labels-483"><span class="linenos">483</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-484"><a href="#CategoricalClassification.generate_labels-484"><span class="linenos">484</span></a>
-</span><span id="CategoricalClassification.generate_labels-485"><a href="#CategoricalClassification.generate_labels-485"><span class="linenos">485</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-486"><a href="#CategoricalClassification.generate_labels-486"><span class="linenos">486</span></a>                    <span class="k">for</span> <span class="n">p_point</span> <span class="ow">in</span> <span class="n">p_points</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_labels-487"><a href="#CategoricalClassification.generate_labels-487"><span class="linenos">487</span></a>                        <span class="n">y</span> <span class="o">+=</span> <span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-488"><a href="#CategoricalClassification.generate_labels-488"><span class="linenos">488</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_labels-489"><a href="#CategoricalClassification.generate_labels-489"><span class="linenos">489</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-490"><a href="#CategoricalClassification.generate_labels-490"><span class="linenos">490</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="o">*</span> <span class="mi">100</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">p</span><span class="p">]</span>
-</span><span id="CategoricalClassification.generate_labels-491"><a href="#CategoricalClassification.generate_labels-491"><span class="linenos">491</span></a>
-</span><span id="CategoricalClassification.generate_labels-492"><a href="#CategoricalClassification.generate_labels-492"><span class="linenos">492</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
-</span><span id="CategoricalClassification.generate_labels-493"><a href="#CategoricalClassification.generate_labels-493"><span class="linenos">493</span></a>                        <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">+=</span> <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span>
-</span><span id="CategoricalClassification.generate_labels-494"><a href="#CategoricalClassification.generate_labels-494"><span class="linenos">494</span></a>
-</span><span id="CategoricalClassification.generate_labels-495"><a href="#CategoricalClassification.generate_labels-495"><span class="linenos">495</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">insert</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-496"><a href="#CategoricalClassification.generate_labels-496"><span class="linenos">496</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">pop</span><span class="p">()</span>
-</span><span id="CategoricalClassification.generate_labels-497"><a href="#CategoricalClassification.generate_labels-497"><span class="linenos">497</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-463"><a href="#CategoricalClassification.generate_labels-463"><span class="linenos">463</span></a>        <span class="k">if</span> <span class="n">p</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span> <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;p must be less than 1.0&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-464"><a href="#CategoricalClassification.generate_labels-464"><span class="linenos">464</span></a>
+</span><span id="CategoricalClassification.generate_labels-465"><a href="#CategoricalClassification.generate_labels-465"><span class="linenos">465</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification.generate_labels-466"><a href="#CategoricalClassification.generate_labels-466"><span class="linenos">466</span></a>
+</span><span id="CategoricalClassification.generate_labels-467"><a href="#CategoricalClassification.generate_labels-467"><span class="linenos">467</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-468"><a href="#CategoricalClassification.generate_labels-468"><span class="linenos">468</span></a>            <span class="k">if</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;linear&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-469"><a href="#CategoricalClassification.generate_labels-469"><span class="linenos">469</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="n">x</span> <span class="o">+</span> <span class="mi">3</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-470"><a href="#CategoricalClassification.generate_labels-470"><span class="linenos">470</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;nonlinear&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-471"><a href="#CategoricalClassification.generate_labels-471"><span class="linenos">471</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="o">+</span> <span class="n">k</span> <span class="o">*</span> <span class="n">np</span><span class="o">.</span><span class="n">cos</span><span class="p">(</span><span class="n">x</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-472"><a href="#CategoricalClassification.generate_labels-472"><span class="linenos">472</span></a>            <span class="k">elif</span> <span class="n">class_relation</span> <span class="o">==</span> <span class="s1">&#39;cluster&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-473"><a href="#CategoricalClassification.generate_labels-473"><span class="linenos">473</span></a>                <span class="n">decision_function</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="CategoricalClassification.generate_labels-474"><a href="#CategoricalClassification.generate_labels-474"><span class="linenos">474</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-475"><a href="#CategoricalClassification.generate_labels-475"><span class="linenos">475</span></a>            <span class="n">class_relation</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">decision_function</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-476"><a href="#CategoricalClassification.generate_labels-476"><span class="linenos">476</span></a>
+</span><span id="CategoricalClassification.generate_labels-477"><a href="#CategoricalClassification.generate_labels-477"><span class="linenos">477</span></a>        <span class="n">y</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification.generate_labels-478"><a href="#CategoricalClassification.generate_labels-478"><span class="linenos">478</span></a>        <span class="k">if</span> <span class="n">decision_function</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-479"><a href="#CategoricalClassification.generate_labels-479"><span class="linenos">479</span></a>            <span class="k">if</span> <span class="n">n</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-480"><a href="#CategoricalClassification.generate_labels-480"><span class="linenos">480</span></a>                <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">p</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">list</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-481"><a href="#CategoricalClassification.generate_labels-481"><span class="linenos">481</span></a>                    <span class="n">p</span> <span class="o">=</span> <span class="mi">1</span> <span class="o">/</span> <span class="n">n</span>
+</span><span id="CategoricalClassification.generate_labels-482"><a href="#CategoricalClassification.generate_labels-482"><span class="linenos">482</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_labels-483"><a href="#CategoricalClassification.generate_labels-483"><span class="linenos">483</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="CategoricalClassification.generate_labels-484"><a href="#CategoricalClassification.generate_labels-484"><span class="linenos">484</span></a>                        <span class="n">percentiles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="p">(</span><span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_labels-485"><a href="#CategoricalClassification.generate_labels-485"><span class="linenos">485</span></a>
+</span><span id="CategoricalClassification.generate_labels-486"><a href="#CategoricalClassification.generate_labels-486"><span class="linenos">486</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-487"><a href="#CategoricalClassification.generate_labels-487"><span class="linenos">487</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-488"><a href="#CategoricalClassification.generate_labels-488"><span class="linenos">488</span></a>
+</span><span id="CategoricalClassification.generate_labels-489"><a href="#CategoricalClassification.generate_labels-489"><span class="linenos">489</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-490"><a href="#CategoricalClassification.generate_labels-490"><span class="linenos">490</span></a>                    <span class="k">for</span> <span class="n">p_point</span> <span class="ow">in</span> <span class="n">p_points</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-491"><a href="#CategoricalClassification.generate_labels-491"><span class="linenos">491</span></a>                        <span class="n">y</span> <span class="o">+=</span> <span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-492"><a href="#CategoricalClassification.generate_labels-492"><span class="linenos">492</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-493"><a href="#CategoricalClassification.generate_labels-493"><span class="linenos">493</span></a>                    <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-494"><a href="#CategoricalClassification.generate_labels-494"><span class="linenos">494</span></a>                    <span class="n">percentiles</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="o">*</span> <span class="mi">100</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">p</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_labels-495"><a href="#CategoricalClassification.generate_labels-495"><span class="linenos">495</span></a>
+</span><span id="CategoricalClassification.generate_labels-496"><a href="#CategoricalClassification.generate_labels-496"><span class="linenos">496</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="CategoricalClassification.generate_labels-497"><a href="#CategoricalClassification.generate_labels-497"><span class="linenos">497</span></a>                        <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">+=</span> <span class="n">percentiles</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span>
 </span><span id="CategoricalClassification.generate_labels-498"><a href="#CategoricalClassification.generate_labels-498"><span class="linenos">498</span></a>
-</span><span id="CategoricalClassification.generate_labels-499"><a href="#CategoricalClassification.generate_labels-499"><span class="linenos">499</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-500"><a href="#CategoricalClassification.generate_labels-500"><span class="linenos">500</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">p_points</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-501"><a href="#CategoricalClassification.generate_labels-501"><span class="linenos">501</span></a>
-</span><span id="CategoricalClassification.generate_labels-502"><a href="#CategoricalClassification.generate_labels-502"><span class="linenos">502</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-503"><a href="#CategoricalClassification.generate_labels-503"><span class="linenos">503</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span><span class="p">):</span>
-</span><span id="CategoricalClassification.generate_labels-504"><a href="#CategoricalClassification.generate_labels-504"><span class="linenos">504</span></a>                        <span class="n">p_point</span> <span class="o">=</span> <span class="n">p_points</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
-</span><span id="CategoricalClassification.generate_labels-505"><a href="#CategoricalClassification.generate_labels-505"><span class="linenos">505</span></a>                        <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">)):</span>
-</span><span id="CategoricalClassification.generate_labels-506"><a href="#CategoricalClassification.generate_labels-506"><span class="linenos">506</span></a>                            <span class="k">if</span> <span class="n">decision_boundary</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_labels-507"><a href="#CategoricalClassification.generate_labels-507"><span class="linenos">507</span></a>                                <span class="n">y</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="CategoricalClassification.generate_labels-508"><a href="#CategoricalClassification.generate_labels-508"><span class="linenos">508</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_labels-509"><a href="#CategoricalClassification.generate_labels-509"><span class="linenos">509</span></a>                <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-510"><a href="#CategoricalClassification.generate_labels-510"><span class="linenos">510</span></a>                <span class="n">p_point</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-511"><a href="#CategoricalClassification.generate_labels-511"><span class="linenos">511</span></a>                <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-512"><a href="#CategoricalClassification.generate_labels-512"><span class="linenos">512</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_labels-513"><a href="#CategoricalClassification.generate_labels-513"><span class="linenos">513</span></a>            <span class="k">if</span> <span class="n">p</span> <span class="o">==</span> <span class="mf">0.5</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_labels-514"><a href="#CategoricalClassification.generate_labels-514"><span class="linenos">514</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="mf">1.0</span>
-</span><span id="CategoricalClassification.generate_labels-515"><a href="#CategoricalClassification.generate_labels-515"><span class="linenos">515</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_labels-516"><a href="#CategoricalClassification.generate_labels-516"><span class="linenos">516</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span><span class="p">,</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">p</span><span class="p">]</span>
-</span><span id="CategoricalClassification.generate_labels-517"><a href="#CategoricalClassification.generate_labels-517"><span class="linenos">517</span></a>            <span class="n">y</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_cluster_data</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">n</span><span class="p">,</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">,</span> <span class="n">balance</span><span class="o">=</span><span class="n">balance</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_labels-518"><a href="#CategoricalClassification.generate_labels-518"><span class="linenos">518</span></a>
-</span><span id="CategoricalClassification.generate_labels-519"><a href="#CategoricalClassification.generate_labels-519"><span class="linenos">519</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
-</span><span id="CategoricalClassification.generate_labels-520"><a href="#CategoricalClassification.generate_labels-520"><span class="linenos">520</span></a>            <span class="s1">&#39;labels&#39;</span><span class="p">:</span> <span class="p">{</span>
-</span><span id="CategoricalClassification.generate_labels-521"><a href="#CategoricalClassification.generate_labels-521"><span class="linenos">521</span></a>                <span class="s1">&#39;class_relation&#39;</span><span class="p">:</span> <span class="n">class_relation</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_labels-522"><a href="#CategoricalClassification.generate_labels-522"><span class="linenos">522</span></a>                <span class="s1">&#39;n_class&#39;</span><span class="p">:</span> <span class="n">n</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_labels-523"><a href="#CategoricalClassification.generate_labels-523"><span class="linenos">523</span></a>            <span class="p">},</span>
-</span><span id="CategoricalClassification.generate_labels-524"><a href="#CategoricalClassification.generate_labels-524"><span class="linenos">524</span></a>        <span class="p">})</span>
-</span><span id="CategoricalClassification.generate_labels-525"><a href="#CategoricalClassification.generate_labels-525"><span class="linenos">525</span></a>
-</span><span id="CategoricalClassification.generate_labels-526"><a href="#CategoricalClassification.generate_labels-526"><span class="linenos">526</span></a>        <span class="k">return</span> <span class="n">y</span>
+</span><span id="CategoricalClassification.generate_labels-499"><a href="#CategoricalClassification.generate_labels-499"><span class="linenos">499</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">insert</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-500"><a href="#CategoricalClassification.generate_labels-500"><span class="linenos">500</span></a>                    <span class="n">percentiles</span><span class="o">.</span><span class="n">pop</span><span class="p">()</span>
+</span><span id="CategoricalClassification.generate_labels-501"><a href="#CategoricalClassification.generate_labels-501"><span class="linenos">501</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">percentiles</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-502"><a href="#CategoricalClassification.generate_labels-502"><span class="linenos">502</span></a>
+</span><span id="CategoricalClassification.generate_labels-503"><a href="#CategoricalClassification.generate_labels-503"><span class="linenos">503</span></a>                    <span class="n">p_points</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">percentiles</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-504"><a href="#CategoricalClassification.generate_labels-504"><span class="linenos">504</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">p_points</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-505"><a href="#CategoricalClassification.generate_labels-505"><span class="linenos">505</span></a>
+</span><span id="CategoricalClassification.generate_labels-506"><a href="#CategoricalClassification.generate_labels-506"><span class="linenos">506</span></a>                    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-507"><a href="#CategoricalClassification.generate_labels-507"><span class="linenos">507</span></a>                    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span><span class="p">):</span>
+</span><span id="CategoricalClassification.generate_labels-508"><a href="#CategoricalClassification.generate_labels-508"><span class="linenos">508</span></a>                        <span class="n">p_point</span> <span class="o">=</span> <span class="n">p_points</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_labels-509"><a href="#CategoricalClassification.generate_labels-509"><span class="linenos">509</span></a>                        <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">)):</span>
+</span><span id="CategoricalClassification.generate_labels-510"><a href="#CategoricalClassification.generate_labels-510"><span class="linenos">510</span></a>                            <span class="k">if</span> <span class="n">decision_boundary</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-511"><a href="#CategoricalClassification.generate_labels-511"><span class="linenos">511</span></a>                                <span class="n">y</span><span class="p">[</span><span class="n">j</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="CategoricalClassification.generate_labels-512"><a href="#CategoricalClassification.generate_labels-512"><span class="linenos">512</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-513"><a href="#CategoricalClassification.generate_labels-513"><span class="linenos">513</span></a>                <span class="n">decision_boundary</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-514"><a href="#CategoricalClassification.generate_labels-514"><span class="linenos">514</span></a>                <span class="n">p_point</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">percentile</span><span class="p">(</span><span class="n">decision_boundary</span><span class="p">,</span> <span class="n">p</span> <span class="o">*</span> <span class="mi">100</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-515"><a href="#CategoricalClassification.generate_labels-515"><span class="linenos">515</span></a>                <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">decision_boundary</span> <span class="o">&gt;</span> <span class="n">p_point</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-516"><a href="#CategoricalClassification.generate_labels-516"><span class="linenos">516</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-517"><a href="#CategoricalClassification.generate_labels-517"><span class="linenos">517</span></a>            <span class="k">if</span> <span class="n">p</span> <span class="o">==</span> <span class="mf">0.5</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-518"><a href="#CategoricalClassification.generate_labels-518"><span class="linenos">518</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="mf">1.0</span>
+</span><span id="CategoricalClassification.generate_labels-519"><a href="#CategoricalClassification.generate_labels-519"><span class="linenos">519</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_labels-520"><a href="#CategoricalClassification.generate_labels-520"><span class="linenos">520</span></a>                <span class="n">p</span> <span class="o">=</span> <span class="p">[</span><span class="n">p</span><span class="p">,</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">p</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_labels-521"><a href="#CategoricalClassification.generate_labels-521"><span class="linenos">521</span></a>            <span class="n">y</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_cluster_data</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">n</span><span class="p">,</span> <span class="n">p</span><span class="o">=</span><span class="n">p</span><span class="p">,</span> <span class="n">balance</span><span class="o">=</span><span class="n">balance</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="n">random_state</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_labels-522"><a href="#CategoricalClassification.generate_labels-522"><span class="linenos">522</span></a>
+</span><span id="CategoricalClassification.generate_labels-523"><a href="#CategoricalClassification.generate_labels-523"><span class="linenos">523</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="CategoricalClassification.generate_labels-524"><a href="#CategoricalClassification.generate_labels-524"><span class="linenos">524</span></a>            <span class="s1">&#39;labels&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="CategoricalClassification.generate_labels-525"><a href="#CategoricalClassification.generate_labels-525"><span class="linenos">525</span></a>                <span class="s1">&#39;class_relation&#39;</span><span class="p">:</span> <span class="n">class_relation</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-526"><a href="#CategoricalClassification.generate_labels-526"><span class="linenos">526</span></a>                <span class="s1">&#39;n_class&#39;</span><span class="p">:</span> <span class="n">n</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_labels-527"><a href="#CategoricalClassification.generate_labels-527"><span class="linenos">527</span></a>            <span class="p">},</span>
+</span><span id="CategoricalClassification.generate_labels-528"><a href="#CategoricalClassification.generate_labels-528"><span class="linenos">528</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification.generate_labels-529"><a href="#CategoricalClassification.generate_labels-529"><span class="linenos">529</span></a>
+</span><span id="CategoricalClassification.generate_labels-530"><a href="#CategoricalClassification.generate_labels-530"><span class="linenos">530</span></a>        <span class="k">return</span> <span class="n">y</span>
 </span></pre></div>
 
 
@@ -2299,6 +2270,7 @@ <h6 id="parameters">Parameters</h6>
 <li><strong>decision_function</strong>:  optional user-defined decision function</li>
 <li><strong>class_relation</strong>:  string, either 'linear', 'nonlinear', or 'cluster'</li>
 <li><strong>balance</strong>:  boolean, whether to balance clustering class labels</li>
+<li><strong>random_state</strong>:  seed for KMeans clustering, defaults to 42</li>
 </ul>
 
 <h6 id="returns">Returns</h6>
@@ -2315,105 +2287,108 @@ <h6 id="returns">Returns</h6>
 <div class="attr function">
             
         <span class="def">def</span>
-        <span class="name">generate_noise</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">X</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">y</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.2</span>,</span><span class="param">	<span class="nb">type</span><span class="p">:</span> <span class="n">Literal</span> <span class="o">=</span> <span class="s1">&#39;categorical&#39;</span>,</span><span class="param">	<span class="n">missing_val</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="o">-</span><span class="n">inf</span></span><span class="return-annotation">) -> <span class="n">numpy</span><span class="o">.</span><span class="n">ndarray</span>:</span></span>
+        <span class="name">generate_noise</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">X</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">y</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]],</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_array_like</span><span class="o">.</span><span class="n">_SupportsArray</span><span class="p">[</span><span class="n">numpy</span><span class="o">.</span><span class="n">dtype</span><span class="p">[</span><span class="n">Any</span><span class="p">]]],</span> <span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">,</span> <span class="n">numpy</span><span class="o">.</span><span class="n">_typing</span><span class="o">.</span><span class="n">_nested_sequence</span><span class="o">.</span><span class="n">_NestedSequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">bool</span><span class="p">,</span> <span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">complex</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="nb">bytes</span><span class="p">]]]</span>,</span><span class="param">	<span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.2</span>,</span><span class="param">	<span class="nb">type</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;categorical&#39;</span><span class="p">,</span> <span class="s1">&#39;missing&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;categorical&#39;</span>,</span><span class="param">	<span class="n">missing_val</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="o">-</span><span class="n">inf</span></span><span class="return-annotation">) -> <span class="n">numpy</span><span class="o">.</span><span class="n">ndarray</span>:</span></span>
 
                 <label class="view-source-button" for="CategoricalClassification.generate_noise-view-source"><span>View Source</span></label>
 
     </div>
     <a class="headerlink" href="#CategoricalClassification.generate_noise"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_noise-624"><a href="#CategoricalClassification.generate_noise-624"><span class="linenos">624</span></a>    <span class="k">def</span> <span class="nf">generate_noise</span><span class="p">(</span>
-</span><span id="CategoricalClassification.generate_noise-625"><a href="#CategoricalClassification.generate_noise-625"><span class="linenos">625</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_noise-626"><a href="#CategoricalClassification.generate_noise-626"><span class="linenos">626</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_noise-627"><a href="#CategoricalClassification.generate_noise-627"><span class="linenos">627</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_noise-628"><a href="#CategoricalClassification.generate_noise-628"><span class="linenos">628</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.2</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_noise-629"><a href="#CategoricalClassification.generate_noise-629"><span class="linenos">629</span></a>        <span class="nb">type</span><span class="p">:</span> <span class="n">Literal</span> <span class="o">=</span> <span class="s1">&#39;categorical&#39;</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_noise-630"><a href="#CategoricalClassification.generate_noise-630"><span class="linenos">630</span></a>        <span class="n">missing_val</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;-inf&#39;</span><span class="p">),</span>
-</span><span id="CategoricalClassification.generate_noise-631"><a href="#CategoricalClassification.generate_noise-631"><span class="linenos">631</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_noise-632"><a href="#CategoricalClassification.generate_noise-632"><span class="linenos">632</span></a>
-</span><span id="CategoricalClassification.generate_noise-633"><a href="#CategoricalClassification.generate_noise-633"><span class="linenos">633</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification.generate_noise-634"><a href="#CategoricalClassification.generate_noise-634"><span class="linenos">634</span></a><span class="sd">        Simulates noise on given dataset X</span>
-</span><span id="CategoricalClassification.generate_noise-635"><a href="#CategoricalClassification.generate_noise-635"><span class="linenos">635</span></a><span class="sd">        :param X: dataset to apply noise to</span>
-</span><span id="CategoricalClassification.generate_noise-636"><a href="#CategoricalClassification.generate_noise-636"><span class="linenos">636</span></a><span class="sd">        :param y: required target labels for categorical noise generation</span>
-</span><span id="CategoricalClassification.generate_noise-637"><a href="#CategoricalClassification.generate_noise-637"><span class="linenos">637</span></a><span class="sd">        :param p: amount of noise to apply. Defaults to 0.2</span>
-</span><span id="CategoricalClassification.generate_noise-638"><a href="#CategoricalClassification.generate_noise-638"><span class="linenos">638</span></a><span class="sd">        :param type: type of noise to apply, either categorical or missing</span>
-</span><span id="CategoricalClassification.generate_noise-639"><a href="#CategoricalClassification.generate_noise-639"><span class="linenos">639</span></a><span class="sd">        :param missing_val: value to simulate missing values. Defaults to float(&#39;-inf&#39;)</span>
-</span><span id="CategoricalClassification.generate_noise-640"><a href="#CategoricalClassification.generate_noise-640"><span class="linenos">640</span></a><span class="sd">        :return: X with noise applied</span>
-</span><span id="CategoricalClassification.generate_noise-641"><a href="#CategoricalClassification.generate_noise-641"><span class="linenos">641</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification.generate_noise-642"><a href="#CategoricalClassification.generate_noise-642"><span class="linenos">642</span></a>
-</span><span id="CategoricalClassification.generate_noise-643"><a href="#CategoricalClassification.generate_noise-643"><span class="linenos">643</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="CategoricalClassification.generate_noise-644"><a href="#CategoricalClassification.generate_noise-644"><span class="linenos">644</span></a>            <span class="s1">&#39;type&#39;</span><span class="p">:</span> <span class="nb">type</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_noise-645"><a href="#CategoricalClassification.generate_noise-645"><span class="linenos">645</span></a>            <span class="s1">&#39;amount&#39;</span><span class="p">:</span> <span class="n">p</span><span class="p">,</span>
-</span><span id="CategoricalClassification.generate_noise-646"><a href="#CategoricalClassification.generate_noise-646"><span class="linenos">646</span></a>        <span class="p">})</span>
-</span><span id="CategoricalClassification.generate_noise-647"><a href="#CategoricalClassification.generate_noise-647"><span class="linenos">647</span></a>
-</span><span id="CategoricalClassification.generate_noise-648"><a href="#CategoricalClassification.generate_noise-648"><span class="linenos">648</span></a>        <span class="k">if</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;categorical&#39;</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_noise-649"><a href="#CategoricalClassification.generate_noise-649"><span class="linenos">649</span></a>            <span class="n">label_values</span><span class="p">,</span> <span class="n">label_count</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_noise-650"><a href="#CategoricalClassification.generate_noise-650"><span class="linenos">650</span></a>            <span class="n">n_labels</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">label_values</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_noise-651"><a href="#CategoricalClassification.generate_noise-651"><span class="linenos">651</span></a>
-</span><span id="CategoricalClassification.generate_noise-652"><a href="#CategoricalClassification.generate_noise-652"><span class="linenos">652</span></a>            <span class="n">inds</span> <span class="o">=</span> <span class="n">y</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
-</span><span id="CategoricalClassification.generate_noise-653"><a href="#CategoricalClassification.generate_noise-653"><span class="linenos">653</span></a>            <span class="n">y_sort</span> <span class="o">=</span> <span class="n">y</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
-</span><span id="CategoricalClassification.generate_noise-654"><a href="#CategoricalClassification.generate_noise-654"><span class="linenos">654</span></a>            <span class="n">X_sort</span> <span class="o">=</span> <span class="n">X</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.generate_noise-632"><a href="#CategoricalClassification.generate_noise-632"><span class="linenos">632</span></a>    <span class="k">def</span> <span class="nf">generate_noise</span><span class="p">(</span>
+</span><span id="CategoricalClassification.generate_noise-633"><a href="#CategoricalClassification.generate_noise-633"><span class="linenos">633</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_noise-634"><a href="#CategoricalClassification.generate_noise-634"><span class="linenos">634</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_noise-635"><a href="#CategoricalClassification.generate_noise-635"><span class="linenos">635</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_noise-636"><a href="#CategoricalClassification.generate_noise-636"><span class="linenos">636</span></a>        <span class="n">p</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.2</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_noise-637"><a href="#CategoricalClassification.generate_noise-637"><span class="linenos">637</span></a>        <span class="nb">type</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;categorical&#39;</span><span class="p">,</span> <span class="s1">&#39;missing&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;categorical&#39;</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_noise-638"><a href="#CategoricalClassification.generate_noise-638"><span class="linenos">638</span></a>        <span class="n">missing_val</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="nb">int</span> <span class="o">|</span> <span class="nb">float</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;-inf&#39;</span><span class="p">),</span>
+</span><span id="CategoricalClassification.generate_noise-639"><a href="#CategoricalClassification.generate_noise-639"><span class="linenos">639</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-640"><a href="#CategoricalClassification.generate_noise-640"><span class="linenos">640</span></a>
+</span><span id="CategoricalClassification.generate_noise-641"><a href="#CategoricalClassification.generate_noise-641"><span class="linenos">641</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_noise-642"><a href="#CategoricalClassification.generate_noise-642"><span class="linenos">642</span></a><span class="sd">        Simulates noise on given dataset X</span>
+</span><span id="CategoricalClassification.generate_noise-643"><a href="#CategoricalClassification.generate_noise-643"><span class="linenos">643</span></a><span class="sd">        :param X: dataset to apply noise to</span>
+</span><span id="CategoricalClassification.generate_noise-644"><a href="#CategoricalClassification.generate_noise-644"><span class="linenos">644</span></a><span class="sd">        :param y: required target labels for categorical noise generation</span>
+</span><span id="CategoricalClassification.generate_noise-645"><a href="#CategoricalClassification.generate_noise-645"><span class="linenos">645</span></a><span class="sd">        :param p: amount of noise to apply. Defaults to 0.2</span>
+</span><span id="CategoricalClassification.generate_noise-646"><a href="#CategoricalClassification.generate_noise-646"><span class="linenos">646</span></a><span class="sd">        :param type: type of noise to apply, either categorical or missing</span>
+</span><span id="CategoricalClassification.generate_noise-647"><a href="#CategoricalClassification.generate_noise-647"><span class="linenos">647</span></a><span class="sd">        :param missing_val: value to simulate missing values. Defaults to float(&#39;-inf&#39;)</span>
+</span><span id="CategoricalClassification.generate_noise-648"><a href="#CategoricalClassification.generate_noise-648"><span class="linenos">648</span></a><span class="sd">        :return: X with noise applied</span>
+</span><span id="CategoricalClassification.generate_noise-649"><a href="#CategoricalClassification.generate_noise-649"><span class="linenos">649</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.generate_noise-650"><a href="#CategoricalClassification.generate_noise-650"><span class="linenos">650</span></a>
+</span><span id="CategoricalClassification.generate_noise-651"><a href="#CategoricalClassification.generate_noise-651"><span class="linenos">651</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="CategoricalClassification.generate_noise-652"><a href="#CategoricalClassification.generate_noise-652"><span class="linenos">652</span></a>            <span class="s1">&#39;type&#39;</span><span class="p">:</span> <span class="nb">type</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_noise-653"><a href="#CategoricalClassification.generate_noise-653"><span class="linenos">653</span></a>            <span class="s1">&#39;amount&#39;</span><span class="p">:</span> <span class="n">p</span><span class="p">,</span>
+</span><span id="CategoricalClassification.generate_noise-654"><a href="#CategoricalClassification.generate_noise-654"><span class="linenos">654</span></a>        <span class="p">})</span>
 </span><span id="CategoricalClassification.generate_noise-655"><a href="#CategoricalClassification.generate_noise-655"><span class="linenos">655</span></a>
-</span><span id="CategoricalClassification.generate_noise-656"><a href="#CategoricalClassification.generate_noise-656"><span class="linenos">656</span></a>            <span class="n">Xs_T</span> <span class="o">=</span> <span class="n">X_sort</span><span class="o">.</span><span class="n">T</span>
-</span><span id="CategoricalClassification.generate_noise-657"><a href="#CategoricalClassification.generate_noise-657"><span class="linenos">657</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="CategoricalClassification.generate_noise-658"><a href="#CategoricalClassification.generate_noise-658"><span class="linenos">658</span></a>            <span class="n">n_flip</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-656"><a href="#CategoricalClassification.generate_noise-656"><span class="linenos">656</span></a>        <span class="k">if</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;categorical&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-657"><a href="#CategoricalClassification.generate_noise-657"><span class="linenos">657</span></a>            <span class="n">label_values</span><span class="p">,</span> <span class="n">label_count</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-658"><a href="#CategoricalClassification.generate_noise-658"><span class="linenos">658</span></a>            <span class="n">n_labels</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">label_values</span><span class="p">)</span>
 </span><span id="CategoricalClassification.generate_noise-659"><a href="#CategoricalClassification.generate_noise-659"><span class="linenos">659</span></a>
-</span><span id="CategoricalClassification.generate_noise-660"><a href="#CategoricalClassification.generate_noise-660"><span class="linenos">660</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xs_T</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_noise-661"><a href="#CategoricalClassification.generate_noise-661"><span class="linenos">661</span></a>                <span class="n">unique_per_label</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="CategoricalClassification.generate_noise-662"><a href="#CategoricalClassification.generate_noise-662"><span class="linenos">662</span></a>
-</span><span id="CategoricalClassification.generate_noise-663"><a href="#CategoricalClassification.generate_noise-663"><span class="linenos">663</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_labels</span><span class="p">):</span>
-</span><span id="CategoricalClassification.generate_noise-664"><a href="#CategoricalClassification.generate_noise-664"><span class="linenos">664</span></a>                    <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_noise-665"><a href="#CategoricalClassification.generate_noise-665"><span class="linenos">665</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]])</span>
-</span><span id="CategoricalClassification.generate_noise-666"><a href="#CategoricalClassification.generate_noise-666"><span class="linenos">666</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_noise-667"><a href="#CategoricalClassification.generate_noise-667"><span class="linenos">667</span></a>                    <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_noise-668"><a href="#CategoricalClassification.generate_noise-668"><span class="linenos">668</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">-</span> <span class="mi">1</span><span class="p">])</span>
-</span><span id="CategoricalClassification.generate_noise-669"><a href="#CategoricalClassification.generate_noise-669"><span class="linenos">669</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-660"><a href="#CategoricalClassification.generate_noise-660"><span class="linenos">660</span></a>            <span class="n">inds</span> <span class="o">=</span> <span class="n">y</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
+</span><span id="CategoricalClassification.generate_noise-661"><a href="#CategoricalClassification.generate_noise-661"><span class="linenos">661</span></a>            <span class="n">y_sort</span> <span class="o">=</span> <span class="n">y</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_noise-662"><a href="#CategoricalClassification.generate_noise-662"><span class="linenos">662</span></a>            <span class="n">X_sort</span> <span class="o">=</span> <span class="n">X</span><span class="p">[</span><span class="n">inds</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_noise-663"><a href="#CategoricalClassification.generate_noise-663"><span class="linenos">663</span></a>
+</span><span id="CategoricalClassification.generate_noise-664"><a href="#CategoricalClassification.generate_noise-664"><span class="linenos">664</span></a>            <span class="n">Xs_T</span> <span class="o">=</span> <span class="n">X_sort</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification.generate_noise-665"><a href="#CategoricalClassification.generate_noise-665"><span class="linenos">665</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_noise-666"><a href="#CategoricalClassification.generate_noise-666"><span class="linenos">666</span></a>            <span class="n">n_flip</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-667"><a href="#CategoricalClassification.generate_noise-667"><span class="linenos">667</span></a>
+</span><span id="CategoricalClassification.generate_noise-668"><a href="#CategoricalClassification.generate_noise-668"><span class="linenos">668</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xs_T</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-669"><a href="#CategoricalClassification.generate_noise-669"><span class="linenos">669</span></a>                <span class="n">unique_per_label</span> <span class="o">=</span> <span class="p">{}</span>
 </span><span id="CategoricalClassification.generate_noise-670"><a href="#CategoricalClassification.generate_noise-670"><span class="linenos">670</span></a>
-</span><span id="CategoricalClassification.generate_noise-671"><a href="#CategoricalClassification.generate_noise-671"><span class="linenos">671</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_flip</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_noise-672"><a href="#CategoricalClassification.generate_noise-672"><span class="linenos">672</span></a>
-</span><span id="CategoricalClassification.generate_noise-673"><a href="#CategoricalClassification.generate_noise-673"><span class="linenos">673</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_noise-674"><a href="#CategoricalClassification.generate_noise-674"><span class="linenos">674</span></a>                    <span class="n">current_label</span> <span class="o">=</span> <span class="n">y_sort</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span>
-</span><span id="CategoricalClassification.generate_noise-675"><a href="#CategoricalClassification.generate_noise-675"><span class="linenos">675</span></a>                    <span class="n">possible_labels</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">label_values</span> <span class="o">!=</span> <span class="n">current_label</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="CategoricalClassification.generate_noise-676"><a href="#CategoricalClassification.generate_noise-676"><span class="linenos">676</span></a>
-</span><span id="CategoricalClassification.generate_noise-677"><a href="#CategoricalClassification.generate_noise-677"><span class="linenos">677</span></a>                    <span class="c1"># find all unique values from labels != current label</span>
-</span><span id="CategoricalClassification.generate_noise-678"><a href="#CategoricalClassification.generate_noise-678"><span class="linenos">678</span></a>                    <span class="n">values</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span>
-</span><span id="CategoricalClassification.generate_noise-679"><a href="#CategoricalClassification.generate_noise-679"><span class="linenos">679</span></a>                    <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">possible_labels</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_noise-680"><a href="#CategoricalClassification.generate_noise-680"><span class="linenos">680</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">values</span><span class="o">.</span><span class="n">union</span><span class="p">(</span><span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">])</span>
-</span><span id="CategoricalClassification.generate_noise-681"><a href="#CategoricalClassification.generate_noise-681"><span class="linenos">681</span></a>
-</span><span id="CategoricalClassification.generate_noise-682"><a href="#CategoricalClassification.generate_noise-682"><span class="linenos">682</span></a>                    <span class="c1"># remove any overlapping values, ensuring replacement values are unique &amp; from a target label !=</span>
-</span><span id="CategoricalClassification.generate_noise-683"><a href="#CategoricalClassification.generate_noise-683"><span class="linenos">683</span></a>                    <span class="c1"># current label</span>
-</span><span id="CategoricalClassification.generate_noise-684"><a href="#CategoricalClassification.generate_noise-684"><span class="linenos">684</span></a>                    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">current_label</span><span class="p">]</span> <span class="o">&amp;</span> <span class="n">values</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_noise-685"><a href="#CategoricalClassification.generate_noise-685"><span class="linenos">685</span></a>                        <span class="n">values</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">val</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_noise-686"><a href="#CategoricalClassification.generate_noise-686"><span class="linenos">686</span></a>
-</span><span id="CategoricalClassification.generate_noise-687"><a href="#CategoricalClassification.generate_noise-687"><span class="linenos">687</span></a>                    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">values</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_noise-688"><a href="#CategoricalClassification.generate_noise-688"><span class="linenos">688</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_noise-671"><a href="#CategoricalClassification.generate_noise-671"><span class="linenos">671</span></a>                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_labels</span><span class="p">):</span>
+</span><span id="CategoricalClassification.generate_noise-672"><a href="#CategoricalClassification.generate_noise-672"><span class="linenos">672</span></a>                    <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-673"><a href="#CategoricalClassification.generate_noise-673"><span class="linenos">673</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]])</span>
+</span><span id="CategoricalClassification.generate_noise-674"><a href="#CategoricalClassification.generate_noise-674"><span class="linenos">674</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-675"><a href="#CategoricalClassification.generate_noise-675"><span class="linenos">675</span></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-676"><a href="#CategoricalClassification.generate_noise-676"><span class="linenos">676</span></a>                        <span class="n">unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">feature</span><span class="p">[</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]:</span><span class="n">label_count</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="n">label_count</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">-</span> <span class="mi">1</span><span class="p">])</span>
+</span><span id="CategoricalClassification.generate_noise-677"><a href="#CategoricalClassification.generate_noise-677"><span class="linenos">677</span></a>                        <span class="n">unique_per_label</span><span class="p">[</span><span class="n">label_values</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-678"><a href="#CategoricalClassification.generate_noise-678"><span class="linenos">678</span></a>
+</span><span id="CategoricalClassification.generate_noise-679"><a href="#CategoricalClassification.generate_noise-679"><span class="linenos">679</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_flip</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-680"><a href="#CategoricalClassification.generate_noise-680"><span class="linenos">680</span></a>
+</span><span id="CategoricalClassification.generate_noise-681"><a href="#CategoricalClassification.generate_noise-681"><span class="linenos">681</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-682"><a href="#CategoricalClassification.generate_noise-682"><span class="linenos">682</span></a>                    <span class="n">current_label</span> <span class="o">=</span> <span class="n">y_sort</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_noise-683"><a href="#CategoricalClassification.generate_noise-683"><span class="linenos">683</span></a>                    <span class="n">possible_labels</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">(</span><span class="n">label_values</span> <span class="o">!=</span> <span class="n">current_label</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_noise-684"><a href="#CategoricalClassification.generate_noise-684"><span class="linenos">684</span></a>
+</span><span id="CategoricalClassification.generate_noise-685"><a href="#CategoricalClassification.generate_noise-685"><span class="linenos">685</span></a>                    <span class="c1"># find all unique values from labels != current label</span>
+</span><span id="CategoricalClassification.generate_noise-686"><a href="#CategoricalClassification.generate_noise-686"><span class="linenos">686</span></a>                    <span class="n">values</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span>
+</span><span id="CategoricalClassification.generate_noise-687"><a href="#CategoricalClassification.generate_noise-687"><span class="linenos">687</span></a>                    <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">possible_labels</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-688"><a href="#CategoricalClassification.generate_noise-688"><span class="linenos">688</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">values</span><span class="o">.</span><span class="n">union</span><span class="p">(</span><span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">])</span>
 </span><span id="CategoricalClassification.generate_noise-689"><a href="#CategoricalClassification.generate_noise-689"><span class="linenos">689</span></a>
-</span><span id="CategoricalClassification.generate_noise-690"><a href="#CategoricalClassification.generate_noise-690"><span class="linenos">690</span></a>                    <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_noise-691"><a href="#CategoricalClassification.generate_noise-691"><span class="linenos">691</span></a>                        <span class="n">key</span> <span class="o">=</span> <span class="n">possible_labels</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">possible_labels</span><span class="p">))]</span>
-</span><span id="CategoricalClassification.generate_noise-692"><a href="#CategoricalClassification.generate_noise-692"><span class="linenos">692</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
-</span><span id="CategoricalClassification.generate_noise-693"><a href="#CategoricalClassification.generate_noise-693"><span class="linenos">693</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_noise-690"><a href="#CategoricalClassification.generate_noise-690"><span class="linenos">690</span></a>                    <span class="c1"># remove any overlapping values, ensuring replacement values are unique &amp; from a target label !=</span>
+</span><span id="CategoricalClassification.generate_noise-691"><a href="#CategoricalClassification.generate_noise-691"><span class="linenos">691</span></a>                    <span class="c1"># current label</span>
+</span><span id="CategoricalClassification.generate_noise-692"><a href="#CategoricalClassification.generate_noise-692"><span class="linenos">692</span></a>                    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">current_label</span><span class="p">]</span> <span class="o">&amp;</span> <span class="n">values</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-693"><a href="#CategoricalClassification.generate_noise-693"><span class="linenos">693</span></a>                        <span class="n">values</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">val</span><span class="p">)</span>
 </span><span id="CategoricalClassification.generate_noise-694"><a href="#CategoricalClassification.generate_noise-694"><span class="linenos">694</span></a>
-</span><span id="CategoricalClassification.generate_noise-695"><a href="#CategoricalClassification.generate_noise-695"><span class="linenos">695</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">val</span>
-</span><span id="CategoricalClassification.generate_noise-696"><a href="#CategoricalClassification.generate_noise-696"><span class="linenos">696</span></a>
-</span><span id="CategoricalClassification.generate_noise-697"><a href="#CategoricalClassification.generate_noise-697"><span class="linenos">697</span></a>            <span class="n">rev_ind</span> <span class="o">=</span> <span class="n">inds</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
-</span><span id="CategoricalClassification.generate_noise-698"><a href="#CategoricalClassification.generate_noise-698"><span class="linenos">698</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">T</span>
-</span><span id="CategoricalClassification.generate_noise-699"><a href="#CategoricalClassification.generate_noise-699"><span class="linenos">699</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">X_noise</span><span class="p">[</span><span class="n">rev_ind</span><span class="p">]</span>
-</span><span id="CategoricalClassification.generate_noise-700"><a href="#CategoricalClassification.generate_noise-700"><span class="linenos">700</span></a>
-</span><span id="CategoricalClassification.generate_noise-701"><a href="#CategoricalClassification.generate_noise-701"><span class="linenos">701</span></a>            <span class="k">return</span> <span class="n">X_noise</span>
+</span><span id="CategoricalClassification.generate_noise-695"><a href="#CategoricalClassification.generate_noise-695"><span class="linenos">695</span></a>                    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">values</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-696"><a href="#CategoricalClassification.generate_noise-696"><span class="linenos">696</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
+</span><span id="CategoricalClassification.generate_noise-697"><a href="#CategoricalClassification.generate_noise-697"><span class="linenos">697</span></a>
+</span><span id="CategoricalClassification.generate_noise-698"><a href="#CategoricalClassification.generate_noise-698"><span class="linenos">698</span></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-699"><a href="#CategoricalClassification.generate_noise-699"><span class="linenos">699</span></a>                        <span class="n">key</span> <span class="o">=</span> <span class="n">possible_labels</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">possible_labels</span><span class="p">))]</span>
+</span><span id="CategoricalClassification.generate_noise-700"><a href="#CategoricalClassification.generate_noise-700"><span class="linenos">700</span></a>                        <span class="n">values</span> <span class="o">=</span> <span class="n">unique_per_label</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_noise-701"><a href="#CategoricalClassification.generate_noise-701"><span class="linenos">701</span></a>                        <span class="n">val</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">values</span><span class="p">))</span>
 </span><span id="CategoricalClassification.generate_noise-702"><a href="#CategoricalClassification.generate_noise-702"><span class="linenos">702</span></a>
-</span><span id="CategoricalClassification.generate_noise-703"><a href="#CategoricalClassification.generate_noise-703"><span class="linenos">703</span></a>        <span class="k">elif</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;missing&#39;</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_noise-704"><a href="#CategoricalClassification.generate_noise-704"><span class="linenos">704</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_noise-705"><a href="#CategoricalClassification.generate_noise-705"><span class="linenos">705</span></a>            <span class="n">Xn_T</span> <span class="o">=</span> <span class="n">X_noise</span><span class="o">.</span><span class="n">T</span>
-</span><span id="CategoricalClassification.generate_noise-706"><a href="#CategoricalClassification.generate_noise-706"><span class="linenos">706</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="CategoricalClassification.generate_noise-707"><a href="#CategoricalClassification.generate_noise-707"><span class="linenos">707</span></a>            <span class="n">n_missing</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_noise-708"><a href="#CategoricalClassification.generate_noise-708"><span class="linenos">708</span></a>            <span class="c1">#print(&quot;n to delete:&quot;, n_missing)</span>
-</span><span id="CategoricalClassification.generate_noise-709"><a href="#CategoricalClassification.generate_noise-709"><span class="linenos">709</span></a>
-</span><span id="CategoricalClassification.generate_noise-710"><a href="#CategoricalClassification.generate_noise-710"><span class="linenos">710</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xn_T</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_noise-711"><a href="#CategoricalClassification.generate_noise-711"><span class="linenos">711</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_missing</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-</span><span id="CategoricalClassification.generate_noise-712"><a href="#CategoricalClassification.generate_noise-712"><span class="linenos">712</span></a>
-</span><span id="CategoricalClassification.generate_noise-713"><a href="#CategoricalClassification.generate_noise-713"><span class="linenos">713</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
-</span><span id="CategoricalClassification.generate_noise-714"><a href="#CategoricalClassification.generate_noise-714"><span class="linenos">714</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">missing_val</span>
-</span><span id="CategoricalClassification.generate_noise-715"><a href="#CategoricalClassification.generate_noise-715"><span class="linenos">715</span></a>
-</span><span id="CategoricalClassification.generate_noise-716"><a href="#CategoricalClassification.generate_noise-716"><span class="linenos">716</span></a>            <span class="k">return</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification.generate_noise-703"><a href="#CategoricalClassification.generate_noise-703"><span class="linenos">703</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">val</span>
+</span><span id="CategoricalClassification.generate_noise-704"><a href="#CategoricalClassification.generate_noise-704"><span class="linenos">704</span></a>
+</span><span id="CategoricalClassification.generate_noise-705"><a href="#CategoricalClassification.generate_noise-705"><span class="linenos">705</span></a>            <span class="n">rev_ind</span> <span class="o">=</span> <span class="n">inds</span><span class="o">.</span><span class="n">argsort</span><span class="p">()</span>
+</span><span id="CategoricalClassification.generate_noise-706"><a href="#CategoricalClassification.generate_noise-706"><span class="linenos">706</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">Xs_T</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification.generate_noise-707"><a href="#CategoricalClassification.generate_noise-707"><span class="linenos">707</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">X_noise</span><span class="p">[</span><span class="n">rev_ind</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_noise-708"><a href="#CategoricalClassification.generate_noise-708"><span class="linenos">708</span></a>
+</span><span id="CategoricalClassification.generate_noise-709"><a href="#CategoricalClassification.generate_noise-709"><span class="linenos">709</span></a>            <span class="k">return</span> <span class="n">X_noise</span>
+</span><span id="CategoricalClassification.generate_noise-710"><a href="#CategoricalClassification.generate_noise-710"><span class="linenos">710</span></a>
+</span><span id="CategoricalClassification.generate_noise-711"><a href="#CategoricalClassification.generate_noise-711"><span class="linenos">711</span></a>        <span class="k">elif</span> <span class="nb">type</span> <span class="o">==</span> <span class="s1">&#39;missing&#39;</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-712"><a href="#CategoricalClassification.generate_noise-712"><span class="linenos">712</span></a>            <span class="n">X_noise</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-713"><a href="#CategoricalClassification.generate_noise-713"><span class="linenos">713</span></a>            <span class="n">Xn_T</span> <span class="o">=</span> <span class="n">X_noise</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification.generate_noise-714"><a href="#CategoricalClassification.generate_noise-714"><span class="linenos">714</span></a>            <span class="n">n</span> <span class="o">=</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="CategoricalClassification.generate_noise-715"><a href="#CategoricalClassification.generate_noise-715"><span class="linenos">715</span></a>            <span class="n">n_missing</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n</span> <span class="o">*</span> <span class="n">p</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-716"><a href="#CategoricalClassification.generate_noise-716"><span class="linenos">716</span></a>            <span class="c1">#print(&quot;n to delete:&quot;, n_missing)</span>
+</span><span id="CategoricalClassification.generate_noise-717"><a href="#CategoricalClassification.generate_noise-717"><span class="linenos">717</span></a>
+</span><span id="CategoricalClassification.generate_noise-718"><a href="#CategoricalClassification.generate_noise-718"><span class="linenos">718</span></a>            <span class="k">for</span> <span class="n">feature</span> <span class="ow">in</span> <span class="n">Xn_T</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-719"><a href="#CategoricalClassification.generate_noise-719"><span class="linenos">719</span></a>                <span class="n">ixs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">n_missing</span><span class="p">,</span> <span class="n">replace</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+</span><span id="CategoricalClassification.generate_noise-720"><a href="#CategoricalClassification.generate_noise-720"><span class="linenos">720</span></a>
+</span><span id="CategoricalClassification.generate_noise-721"><a href="#CategoricalClassification.generate_noise-721"><span class="linenos">721</span></a>                <span class="k">for</span> <span class="n">ix</span> <span class="ow">in</span> <span class="n">ixs</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-722"><a href="#CategoricalClassification.generate_noise-722"><span class="linenos">722</span></a>                    <span class="n">feature</span><span class="p">[</span><span class="n">ix</span><span class="p">]</span> <span class="o">=</span> <span class="n">missing_val</span>
+</span><span id="CategoricalClassification.generate_noise-723"><a href="#CategoricalClassification.generate_noise-723"><span class="linenos">723</span></a>
+</span><span id="CategoricalClassification.generate_noise-724"><a href="#CategoricalClassification.generate_noise-724"><span class="linenos">724</span></a>            <span class="k">return</span> <span class="n">Xn_T</span><span class="o">.</span><span class="n">T</span>
+</span><span id="CategoricalClassification.generate_noise-725"><a href="#CategoricalClassification.generate_noise-725"><span class="linenos">725</span></a>
+</span><span id="CategoricalClassification.generate_noise-726"><a href="#CategoricalClassification.generate_noise-726"><span class="linenos">726</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.generate_noise-727"><a href="#CategoricalClassification.generate_noise-727"><span class="linenos">727</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Type </span><span class="si">{</span><span class="nb">type</span><span class="si">}</span><span class="s1"> not supported&#39;</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -2449,66 +2424,66 @@ <h6 id="returns">Returns</h6>
 
     </div>
     <a class="headerlink" href="#CategoricalClassification.downsample_dataset"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.downsample_dataset-718"><a href="#CategoricalClassification.downsample_dataset-718"><span class="linenos">718</span></a>    <span class="k">def</span> <span class="nf">downsample_dataset</span><span class="p">(</span>
-</span><span id="CategoricalClassification.downsample_dataset-719"><a href="#CategoricalClassification.downsample_dataset-719"><span class="linenos">719</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification.downsample_dataset-720"><a href="#CategoricalClassification.downsample_dataset-720"><span class="linenos">720</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification.downsample_dataset-721"><a href="#CategoricalClassification.downsample_dataset-721"><span class="linenos">721</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification.downsample_dataset-722"><a href="#CategoricalClassification.downsample_dataset-722"><span class="linenos">722</span></a>        <span class="n">N</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="CategoricalClassification.downsample_dataset-723"><a href="#CategoricalClassification.downsample_dataset-723"><span class="linenos">723</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
-</span><span id="CategoricalClassification.downsample_dataset-724"><a href="#CategoricalClassification.downsample_dataset-724"><span class="linenos">724</span></a>        <span class="n">reshuffle</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="CategoricalClassification.downsample_dataset-725"><a href="#CategoricalClassification.downsample_dataset-725"><span class="linenos">725</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">]:</span>
-</span><span id="CategoricalClassification.downsample_dataset-726"><a href="#CategoricalClassification.downsample_dataset-726"><span class="linenos">726</span></a>
-</span><span id="CategoricalClassification.downsample_dataset-727"><a href="#CategoricalClassification.downsample_dataset-727"><span class="linenos">727</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification.downsample_dataset-728"><a href="#CategoricalClassification.downsample_dataset-728"><span class="linenos">728</span></a><span class="sd">        Downsamples dataset X according to N or the number of samples in minority class, resulting in a balanced dataset.</span>
-</span><span id="CategoricalClassification.downsample_dataset-729"><a href="#CategoricalClassification.downsample_dataset-729"><span class="linenos">729</span></a><span class="sd">        :param X: Dataset to downsample</span>
-</span><span id="CategoricalClassification.downsample_dataset-730"><a href="#CategoricalClassification.downsample_dataset-730"><span class="linenos">730</span></a><span class="sd">        :param y: Labels corresponding to X</span>
-</span><span id="CategoricalClassification.downsample_dataset-731"><a href="#CategoricalClassification.downsample_dataset-731"><span class="linenos">731</span></a><span class="sd">        :param N: Optional number of samples per class to downsample to</span>
-</span><span id="CategoricalClassification.downsample_dataset-732"><a href="#CategoricalClassification.downsample_dataset-732"><span class="linenos">732</span></a><span class="sd">        :param seed: Seed for random state of resample function</span>
-</span><span id="CategoricalClassification.downsample_dataset-733"><a href="#CategoricalClassification.downsample_dataset-733"><span class="linenos">733</span></a><span class="sd">        :param reshuffle: Reshuffle the dataset after downsampling</span>
-</span><span id="CategoricalClassification.downsample_dataset-734"><a href="#CategoricalClassification.downsample_dataset-734"><span class="linenos">734</span></a><span class="sd">        :return: Balanced X and y after downsampling</span>
-</span><span id="CategoricalClassification.downsample_dataset-735"><a href="#CategoricalClassification.downsample_dataset-735"><span class="linenos">735</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification.downsample_dataset-736"><a href="#CategoricalClassification.downsample_dataset-736"><span class="linenos">736</span></a>
-</span><span id="CategoricalClassification.downsample_dataset-737"><a href="#CategoricalClassification.downsample_dataset-737"><span class="linenos">737</span></a>        <span class="n">original_shape</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="CategoricalClassification.downsample_dataset-738"><a href="#CategoricalClassification.downsample_dataset-738"><span class="linenos">738</span></a>
-</span><span id="CategoricalClassification.downsample_dataset-739"><a href="#CategoricalClassification.downsample_dataset-739"><span class="linenos">739</span></a>        <span class="n">values</span><span class="p">,</span> <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="CategoricalClassification.downsample_dataset-740"><a href="#CategoricalClassification.downsample_dataset-740"><span class="linenos">740</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="CategoricalClassification.downsample_dataset-741"><a href="#CategoricalClassification.downsample_dataset-741"><span class="linenos">741</span></a>            <span class="n">N</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">)</span>
-</span><span id="CategoricalClassification.downsample_dataset-742"><a href="#CategoricalClassification.downsample_dataset-742"><span class="linenos">742</span></a>
-</span><span id="CategoricalClassification.downsample_dataset-743"><a href="#CategoricalClassification.downsample_dataset-743"><span class="linenos">743</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="o">&gt;</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">):</span>
-</span><span id="CategoricalClassification.downsample_dataset-744"><a href="#CategoricalClassification.downsample_dataset-744"><span class="linenos">744</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;N must be equal to or less than the number of samples in minority class&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.downsample_dataset-745"><a href="#CategoricalClassification.downsample_dataset-745"><span class="linenos">745</span></a>
-</span><span id="CategoricalClassification.downsample_dataset-746"><a href="#CategoricalClassification.downsample_dataset-746"><span class="linenos">746</span></a>        <span class="n">X_arrays_list</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="CategoricalClassification.downsample_dataset-747"><a href="#CategoricalClassification.downsample_dataset-747"><span class="linenos">747</span></a>        <span class="n">y_downsampled</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="CategoricalClassification.downsample_dataset-748"><a href="#CategoricalClassification.downsample_dataset-748"><span class="linenos">748</span></a>        <span class="k">for</span> <span class="n">label</span> <span class="ow">in</span> <span class="n">values</span><span class="p">:</span>
-</span><span id="CategoricalClassification.downsample_dataset-749"><a href="#CategoricalClassification.downsample_dataset-749"><span class="linenos">749</span></a>            <span class="n">X_label</span> <span class="o">=</span> <span class="p">[</span><span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">y</span><span class="p">))</span> <span class="k">if</span> <span class="n">y</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">==</span> <span class="n">label</span><span class="p">]</span>
-</span><span id="CategoricalClassification.downsample_dataset-750"><a href="#CategoricalClassification.downsample_dataset-750"><span class="linenos">750</span></a>            <span class="n">X_label_downsample</span> <span class="o">=</span> <span class="n">resample</span><span class="p">(</span>
-</span><span id="CategoricalClassification.downsample_dataset-751"><a href="#CategoricalClassification.downsample_dataset-751"><span class="linenos">751</span></a>                <span class="n">X_label</span><span class="p">,</span>
-</span><span id="CategoricalClassification.downsample_dataset-752"><a href="#CategoricalClassification.downsample_dataset-752"><span class="linenos">752</span></a>                <span class="n">replace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-</span><span id="CategoricalClassification.downsample_dataset-753"><a href="#CategoricalClassification.downsample_dataset-753"><span class="linenos">753</span></a>                <span class="n">n_samples</span><span class="o">=</span><span class="n">N</span><span class="p">,</span>
-</span><span id="CategoricalClassification.downsample_dataset-754"><a href="#CategoricalClassification.downsample_dataset-754"><span class="linenos">754</span></a>                <span class="n">random_state</span><span class="o">=</span><span class="n">seed</span><span class="p">,</span>
-</span><span id="CategoricalClassification.downsample_dataset-755"><a href="#CategoricalClassification.downsample_dataset-755"><span class="linenos">755</span></a>            <span class="p">)</span>
-</span><span id="CategoricalClassification.downsample_dataset-756"><a href="#CategoricalClassification.downsample_dataset-756"><span class="linenos">756</span></a>            <span class="n">X_arrays_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">X_label_downsample</span><span class="p">)</span>
-</span><span id="CategoricalClassification.downsample_dataset-757"><a href="#CategoricalClassification.downsample_dataset-757"><span class="linenos">757</span></a>            <span class="n">ys</span> <span class="o">=</span> <span class="p">[</span><span class="n">label</span><span class="p">]</span> <span class="o">*</span> <span class="n">N</span>
-</span><span id="CategoricalClassification.downsample_dataset-758"><a href="#CategoricalClassification.downsample_dataset-758"><span class="linenos">758</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">y_downsampled</span><span class="p">,</span> <span class="n">ys</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="CategoricalClassification.downsample_dataset-759"><a href="#CategoricalClassification.downsample_dataset-759"><span class="linenos">759</span></a>
-</span><span id="CategoricalClassification.downsample_dataset-760"><a href="#CategoricalClassification.downsample_dataset-760"><span class="linenos">760</span></a>        <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">X_arrays_list</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</span><span id="CategoricalClassification.downsample_dataset-761"><a href="#CategoricalClassification.downsample_dataset-761"><span class="linenos">761</span></a>
-</span><span id="CategoricalClassification.downsample_dataset-762"><a href="#CategoricalClassification.downsample_dataset-762"><span class="linenos">762</span></a>        <span class="k">if</span> <span class="n">reshuffle</span><span class="p">:</span>
-</span><span id="CategoricalClassification.downsample_dataset-763"><a href="#CategoricalClassification.downsample_dataset-763"><span class="linenos">763</span></a>            <span class="n">indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X_downsampled</span><span class="p">))</span>
-</span><span id="CategoricalClassification.downsample_dataset-764"><a href="#CategoricalClassification.downsample_dataset-764"><span class="linenos">764</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">indices</span><span class="p">)</span>
-</span><span id="CategoricalClassification.downsample_dataset-765"><a href="#CategoricalClassification.downsample_dataset-765"><span class="linenos">765</span></a>            <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
-</span><span id="CategoricalClassification.downsample_dataset-766"><a href="#CategoricalClassification.downsample_dataset-766"><span class="linenos">766</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">y_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
-</span><span id="CategoricalClassification.downsample_dataset-767"><a href="#CategoricalClassification.downsample_dataset-767"><span class="linenos">767</span></a>
-</span><span id="CategoricalClassification.downsample_dataset-768"><a href="#CategoricalClassification.downsample_dataset-768"><span class="linenos">768</span></a>        <span class="n">downsampled_shape</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="CategoricalClassification.downsample_dataset-769"><a href="#CategoricalClassification.downsample_dataset-769"><span class="linenos">769</span></a>
-</span><span id="CategoricalClassification.downsample_dataset-770"><a href="#CategoricalClassification.downsample_dataset-770"><span class="linenos">770</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
-</span><span id="CategoricalClassification.downsample_dataset-771"><a href="#CategoricalClassification.downsample_dataset-771"><span class="linenos">771</span></a>            <span class="s1">&#39;downsampling&#39;</span><span class="p">:</span> <span class="p">{</span>
-</span><span id="CategoricalClassification.downsample_dataset-772"><a href="#CategoricalClassification.downsample_dataset-772"><span class="linenos">772</span></a>                <span class="s1">&#39;original_shape&#39;</span><span class="p">:</span> <span class="n">original_shape</span><span class="p">,</span>
-</span><span id="CategoricalClassification.downsample_dataset-773"><a href="#CategoricalClassification.downsample_dataset-773"><span class="linenos">773</span></a>                <span class="s1">&#39;downsampled_shape&#39;</span><span class="p">:</span> <span class="n">downsampled_shape</span><span class="p">,</span>
-</span><span id="CategoricalClassification.downsample_dataset-774"><a href="#CategoricalClassification.downsample_dataset-774"><span class="linenos">774</span></a>            <span class="p">},</span>
-</span><span id="CategoricalClassification.downsample_dataset-775"><a href="#CategoricalClassification.downsample_dataset-775"><span class="linenos">775</span></a>        <span class="p">})</span>
-</span><span id="CategoricalClassification.downsample_dataset-776"><a href="#CategoricalClassification.downsample_dataset-776"><span class="linenos">776</span></a>
-</span><span id="CategoricalClassification.downsample_dataset-777"><a href="#CategoricalClassification.downsample_dataset-777"><span class="linenos">777</span></a>        <span class="k">return</span> <span class="n">X_downsampled</span><span class="p">,</span> <span class="n">y_downsampled</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.downsample_dataset-729"><a href="#CategoricalClassification.downsample_dataset-729"><span class="linenos">729</span></a>    <span class="k">def</span> <span class="nf">downsample_dataset</span><span class="p">(</span>
+</span><span id="CategoricalClassification.downsample_dataset-730"><a href="#CategoricalClassification.downsample_dataset-730"><span class="linenos">730</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-731"><a href="#CategoricalClassification.downsample_dataset-731"><span class="linenos">731</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-732"><a href="#CategoricalClassification.downsample_dataset-732"><span class="linenos">732</span></a>        <span class="n">y</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">|</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-733"><a href="#CategoricalClassification.downsample_dataset-733"><span class="linenos">733</span></a>        <span class="n">N</span><span class="p">:</span> <span class="nb">int</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-734"><a href="#CategoricalClassification.downsample_dataset-734"><span class="linenos">734</span></a>        <span class="n">seed</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">42</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-735"><a href="#CategoricalClassification.downsample_dataset-735"><span class="linenos">735</span></a>        <span class="n">reshuffle</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-736"><a href="#CategoricalClassification.downsample_dataset-736"><span class="linenos">736</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">]:</span>
+</span><span id="CategoricalClassification.downsample_dataset-737"><a href="#CategoricalClassification.downsample_dataset-737"><span class="linenos">737</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-738"><a href="#CategoricalClassification.downsample_dataset-738"><span class="linenos">738</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.downsample_dataset-739"><a href="#CategoricalClassification.downsample_dataset-739"><span class="linenos">739</span></a><span class="sd">        Downsamples dataset X according to N or the number of samples in minority class, resulting in a balanced dataset.</span>
+</span><span id="CategoricalClassification.downsample_dataset-740"><a href="#CategoricalClassification.downsample_dataset-740"><span class="linenos">740</span></a><span class="sd">        :param X: Dataset to downsample</span>
+</span><span id="CategoricalClassification.downsample_dataset-741"><a href="#CategoricalClassification.downsample_dataset-741"><span class="linenos">741</span></a><span class="sd">        :param y: Labels corresponding to X</span>
+</span><span id="CategoricalClassification.downsample_dataset-742"><a href="#CategoricalClassification.downsample_dataset-742"><span class="linenos">742</span></a><span class="sd">        :param N: Optional number of samples per class to downsample to</span>
+</span><span id="CategoricalClassification.downsample_dataset-743"><a href="#CategoricalClassification.downsample_dataset-743"><span class="linenos">743</span></a><span class="sd">        :param seed: Seed for random state of resample function</span>
+</span><span id="CategoricalClassification.downsample_dataset-744"><a href="#CategoricalClassification.downsample_dataset-744"><span class="linenos">744</span></a><span class="sd">        :param reshuffle: Reshuffle the dataset after downsampling</span>
+</span><span id="CategoricalClassification.downsample_dataset-745"><a href="#CategoricalClassification.downsample_dataset-745"><span class="linenos">745</span></a><span class="sd">        :return: Balanced X and y after downsampling</span>
+</span><span id="CategoricalClassification.downsample_dataset-746"><a href="#CategoricalClassification.downsample_dataset-746"><span class="linenos">746</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.downsample_dataset-747"><a href="#CategoricalClassification.downsample_dataset-747"><span class="linenos">747</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-748"><a href="#CategoricalClassification.downsample_dataset-748"><span class="linenos">748</span></a>        <span class="n">original_shape</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification.downsample_dataset-749"><a href="#CategoricalClassification.downsample_dataset-749"><span class="linenos">749</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-750"><a href="#CategoricalClassification.downsample_dataset-750"><span class="linenos">750</span></a>        <span class="n">values</span><span class="p">,</span> <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="CategoricalClassification.downsample_dataset-751"><a href="#CategoricalClassification.downsample_dataset-751"><span class="linenos">751</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="CategoricalClassification.downsample_dataset-752"><a href="#CategoricalClassification.downsample_dataset-752"><span class="linenos">752</span></a>            <span class="n">N</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">)</span>
+</span><span id="CategoricalClassification.downsample_dataset-753"><a href="#CategoricalClassification.downsample_dataset-753"><span class="linenos">753</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-754"><a href="#CategoricalClassification.downsample_dataset-754"><span class="linenos">754</span></a>        <span class="k">if</span> <span class="n">N</span> <span class="o">&gt;</span> <span class="nb">min</span><span class="p">(</span><span class="n">counts</span><span class="p">):</span>
+</span><span id="CategoricalClassification.downsample_dataset-755"><a href="#CategoricalClassification.downsample_dataset-755"><span class="linenos">755</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s1">&#39;N must be equal to or less than the number of samples in minority class&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.downsample_dataset-756"><a href="#CategoricalClassification.downsample_dataset-756"><span class="linenos">756</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-757"><a href="#CategoricalClassification.downsample_dataset-757"><span class="linenos">757</span></a>        <span class="n">X_arrays_list</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification.downsample_dataset-758"><a href="#CategoricalClassification.downsample_dataset-758"><span class="linenos">758</span></a>        <span class="n">y_downsampled</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="CategoricalClassification.downsample_dataset-759"><a href="#CategoricalClassification.downsample_dataset-759"><span class="linenos">759</span></a>        <span class="k">for</span> <span class="n">label</span> <span class="ow">in</span> <span class="n">values</span><span class="p">:</span>
+</span><span id="CategoricalClassification.downsample_dataset-760"><a href="#CategoricalClassification.downsample_dataset-760"><span class="linenos">760</span></a>            <span class="n">X_label</span> <span class="o">=</span> <span class="p">[</span><span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">y</span><span class="p">))</span> <span class="k">if</span> <span class="n">y</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">==</span> <span class="n">label</span><span class="p">]</span>
+</span><span id="CategoricalClassification.downsample_dataset-761"><a href="#CategoricalClassification.downsample_dataset-761"><span class="linenos">761</span></a>            <span class="n">X_label_downsample</span> <span class="o">=</span> <span class="n">resample</span><span class="p">(</span>
+</span><span id="CategoricalClassification.downsample_dataset-762"><a href="#CategoricalClassification.downsample_dataset-762"><span class="linenos">762</span></a>                <span class="n">X_label</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-763"><a href="#CategoricalClassification.downsample_dataset-763"><span class="linenos">763</span></a>                <span class="n">replace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-764"><a href="#CategoricalClassification.downsample_dataset-764"><span class="linenos">764</span></a>                <span class="n">n_samples</span><span class="o">=</span><span class="n">N</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-765"><a href="#CategoricalClassification.downsample_dataset-765"><span class="linenos">765</span></a>                <span class="n">random_state</span><span class="o">=</span><span class="n">seed</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-766"><a href="#CategoricalClassification.downsample_dataset-766"><span class="linenos">766</span></a>            <span class="p">)</span>
+</span><span id="CategoricalClassification.downsample_dataset-767"><a href="#CategoricalClassification.downsample_dataset-767"><span class="linenos">767</span></a>            <span class="n">X_arrays_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">X_label_downsample</span><span class="p">)</span>
+</span><span id="CategoricalClassification.downsample_dataset-768"><a href="#CategoricalClassification.downsample_dataset-768"><span class="linenos">768</span></a>            <span class="n">ys</span> <span class="o">=</span> <span class="p">[</span><span class="n">label</span><span class="p">]</span> <span class="o">*</span> <span class="n">N</span>
+</span><span id="CategoricalClassification.downsample_dataset-769"><a href="#CategoricalClassification.downsample_dataset-769"><span class="linenos">769</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">y_downsampled</span><span class="p">,</span> <span class="n">ys</span><span class="p">),</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification.downsample_dataset-770"><a href="#CategoricalClassification.downsample_dataset-770"><span class="linenos">770</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-771"><a href="#CategoricalClassification.downsample_dataset-771"><span class="linenos">771</span></a>        <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">X_arrays_list</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="CategoricalClassification.downsample_dataset-772"><a href="#CategoricalClassification.downsample_dataset-772"><span class="linenos">772</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-773"><a href="#CategoricalClassification.downsample_dataset-773"><span class="linenos">773</span></a>        <span class="k">if</span> <span class="n">reshuffle</span><span class="p">:</span>
+</span><span id="CategoricalClassification.downsample_dataset-774"><a href="#CategoricalClassification.downsample_dataset-774"><span class="linenos">774</span></a>            <span class="n">indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X_downsampled</span><span class="p">))</span>
+</span><span id="CategoricalClassification.downsample_dataset-775"><a href="#CategoricalClassification.downsample_dataset-775"><span class="linenos">775</span></a>            <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">shuffle</span><span class="p">(</span><span class="n">indices</span><span class="p">)</span>
+</span><span id="CategoricalClassification.downsample_dataset-776"><a href="#CategoricalClassification.downsample_dataset-776"><span class="linenos">776</span></a>            <span class="n">X_downsampled</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification.downsample_dataset-777"><a href="#CategoricalClassification.downsample_dataset-777"><span class="linenos">777</span></a>            <span class="n">y_downsampled</span> <span class="o">=</span> <span class="n">y_downsampled</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
+</span><span id="CategoricalClassification.downsample_dataset-778"><a href="#CategoricalClassification.downsample_dataset-778"><span class="linenos">778</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-779"><a href="#CategoricalClassification.downsample_dataset-779"><span class="linenos">779</span></a>        <span class="n">downsampled_shape</span> <span class="o">=</span> <span class="n">X_downsampled</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification.downsample_dataset-780"><a href="#CategoricalClassification.downsample_dataset-780"><span class="linenos">780</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-781"><a href="#CategoricalClassification.downsample_dataset-781"><span class="linenos">781</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="CategoricalClassification.downsample_dataset-782"><a href="#CategoricalClassification.downsample_dataset-782"><span class="linenos">782</span></a>            <span class="s1">&#39;downsampling&#39;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="CategoricalClassification.downsample_dataset-783"><a href="#CategoricalClassification.downsample_dataset-783"><span class="linenos">783</span></a>                <span class="s1">&#39;original_shape&#39;</span><span class="p">:</span> <span class="n">original_shape</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-784"><a href="#CategoricalClassification.downsample_dataset-784"><span class="linenos">784</span></a>                <span class="s1">&#39;downsampled_shape&#39;</span><span class="p">:</span> <span class="n">downsampled_shape</span><span class="p">,</span>
+</span><span id="CategoricalClassification.downsample_dataset-785"><a href="#CategoricalClassification.downsample_dataset-785"><span class="linenos">785</span></a>            <span class="p">},</span>
+</span><span id="CategoricalClassification.downsample_dataset-786"><a href="#CategoricalClassification.downsample_dataset-786"><span class="linenos">786</span></a>        <span class="p">})</span>
+</span><span id="CategoricalClassification.downsample_dataset-787"><a href="#CategoricalClassification.downsample_dataset-787"><span class="linenos">787</span></a>
+</span><span id="CategoricalClassification.downsample_dataset-788"><a href="#CategoricalClassification.downsample_dataset-788"><span class="linenos">788</span></a>        <span class="k">return</span> <span class="n">X_downsampled</span><span class="p">,</span> <span class="n">y_downsampled</span>
 </span></pre></div>
 
 
@@ -2544,29 +2519,29 @@ <h6 id="returns">Returns</h6>
 
     </div>
     <a class="headerlink" href="#CategoricalClassification.print_dataset"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.print_dataset-779"><a href="#CategoricalClassification.print_dataset-779"><span class="linenos">779</span></a>    <span class="k">def</span> <span class="nf">print_dataset</span><span class="p">(</span>
-</span><span id="CategoricalClassification.print_dataset-780"><a href="#CategoricalClassification.print_dataset-780"><span class="linenos">780</span></a>        <span class="bp">self</span><span class="p">,</span>
-</span><span id="CategoricalClassification.print_dataset-781"><a href="#CategoricalClassification.print_dataset-781"><span class="linenos">781</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification.print_dataset-782"><a href="#CategoricalClassification.print_dataset-782"><span class="linenos">782</span></a>        <span class="n">y</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
-</span><span id="CategoricalClassification.print_dataset-783"><a href="#CategoricalClassification.print_dataset-783"><span class="linenos">783</span></a>    <span class="p">):</span>
-</span><span id="CategoricalClassification.print_dataset-784"><a href="#CategoricalClassification.print_dataset-784"><span class="linenos">784</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification.print_dataset-785"><a href="#CategoricalClassification.print_dataset-785"><span class="linenos">785</span></a><span class="sd">        Prints given dataset</span>
-</span><span id="CategoricalClassification.print_dataset-786"><a href="#CategoricalClassification.print_dataset-786"><span class="linenos">786</span></a><span class="sd">        :param X: dataset</span>
-</span><span id="CategoricalClassification.print_dataset-787"><a href="#CategoricalClassification.print_dataset-787"><span class="linenos">787</span></a><span class="sd">        :param y: labels</span>
-</span><span id="CategoricalClassification.print_dataset-788"><a href="#CategoricalClassification.print_dataset-788"><span class="linenos">788</span></a><span class="sd">        :return:</span>
-</span><span id="CategoricalClassification.print_dataset-789"><a href="#CategoricalClassification.print_dataset-789"><span class="linenos">789</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="CategoricalClassification.print_dataset-790"><a href="#CategoricalClassification.print_dataset-790"><span class="linenos">790</span></a>
-</span><span id="CategoricalClassification.print_dataset-791"><a href="#CategoricalClassification.print_dataset-791"><span class="linenos">791</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
-</span><span id="CategoricalClassification.print_dataset-792"><a href="#CategoricalClassification.print_dataset-792"><span class="linenos">792</span></a>        <span class="n">n</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="CategoricalClassification.print_dataset-793"><a href="#CategoricalClassification.print_dataset-793"><span class="linenos">793</span></a>        <span class="k">for</span> <span class="n">arr</span> <span class="ow">in</span> <span class="n">X</span><span class="p">:</span>
-</span><span id="CategoricalClassification.print_dataset-794"><a href="#CategoricalClassification.print_dataset-794"><span class="linenos">794</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;[&#39;</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.print_dataset-795"><a href="#CategoricalClassification.print_dataset-795"><span class="linenos">795</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
-</span><span id="CategoricalClassification.print_dataset-796"><a href="#CategoricalClassification.print_dataset-796"><span class="linenos">796</span></a>                <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="n">n_features</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="CategoricalClassification.print_dataset-797"><a href="#CategoricalClassification.print_dataset-797"><span class="linenos">797</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.print_dataset-798"><a href="#CategoricalClassification.print_dataset-798"><span class="linenos">798</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="CategoricalClassification.print_dataset-799"><a href="#CategoricalClassification.print_dataset-799"><span class="linenos">799</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;, &#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.print_dataset-800"><a href="#CategoricalClassification.print_dataset-800"><span class="linenos">800</span></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;], Label: </span><span class="si">{</span><span class="n">y</span><span class="p">[</span><span class="n">n</span><span class="p">]</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.print_dataset-801"><a href="#CategoricalClassification.print_dataset-801"><span class="linenos">801</span></a>            <span class="n">n</span> <span class="o">+=</span> <span class="mi">1</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.print_dataset-790"><a href="#CategoricalClassification.print_dataset-790"><span class="linenos">790</span></a>    <span class="k">def</span> <span class="nf">print_dataset</span><span class="p">(</span>
+</span><span id="CategoricalClassification.print_dataset-791"><a href="#CategoricalClassification.print_dataset-791"><span class="linenos">791</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="CategoricalClassification.print_dataset-792"><a href="#CategoricalClassification.print_dataset-792"><span class="linenos">792</span></a>        <span class="n">X</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.print_dataset-793"><a href="#CategoricalClassification.print_dataset-793"><span class="linenos">793</span></a>        <span class="n">y</span><span class="p">:</span> <span class="n">ArrayLike</span><span class="p">,</span>
+</span><span id="CategoricalClassification.print_dataset-794"><a href="#CategoricalClassification.print_dataset-794"><span class="linenos">794</span></a>    <span class="p">):</span>
+</span><span id="CategoricalClassification.print_dataset-795"><a href="#CategoricalClassification.print_dataset-795"><span class="linenos">795</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.print_dataset-796"><a href="#CategoricalClassification.print_dataset-796"><span class="linenos">796</span></a><span class="sd">        Prints given dataset</span>
+</span><span id="CategoricalClassification.print_dataset-797"><a href="#CategoricalClassification.print_dataset-797"><span class="linenos">797</span></a><span class="sd">        :param X: dataset</span>
+</span><span id="CategoricalClassification.print_dataset-798"><a href="#CategoricalClassification.print_dataset-798"><span class="linenos">798</span></a><span class="sd">        :param y: labels</span>
+</span><span id="CategoricalClassification.print_dataset-799"><a href="#CategoricalClassification.print_dataset-799"><span class="linenos">799</span></a><span class="sd">        :return:</span>
+</span><span id="CategoricalClassification.print_dataset-800"><a href="#CategoricalClassification.print_dataset-800"><span class="linenos">800</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="CategoricalClassification.print_dataset-801"><a href="#CategoricalClassification.print_dataset-801"><span class="linenos">801</span></a>
+</span><span id="CategoricalClassification.print_dataset-802"><a href="#CategoricalClassification.print_dataset-802"><span class="linenos">802</span></a>        <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
+</span><span id="CategoricalClassification.print_dataset-803"><a href="#CategoricalClassification.print_dataset-803"><span class="linenos">803</span></a>        <span class="n">n</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="CategoricalClassification.print_dataset-804"><a href="#CategoricalClassification.print_dataset-804"><span class="linenos">804</span></a>        <span class="k">for</span> <span class="n">arr</span> <span class="ow">in</span> <span class="n">X</span><span class="p">:</span>
+</span><span id="CategoricalClassification.print_dataset-805"><a href="#CategoricalClassification.print_dataset-805"><span class="linenos">805</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;[&#39;</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.print_dataset-806"><a href="#CategoricalClassification.print_dataset-806"><span class="linenos">806</span></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">):</span>
+</span><span id="CategoricalClassification.print_dataset-807"><a href="#CategoricalClassification.print_dataset-807"><span class="linenos">807</span></a>                <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="n">n_features</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="CategoricalClassification.print_dataset-808"><a href="#CategoricalClassification.print_dataset-808"><span class="linenos">808</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.print_dataset-809"><a href="#CategoricalClassification.print_dataset-809"><span class="linenos">809</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="CategoricalClassification.print_dataset-810"><a href="#CategoricalClassification.print_dataset-810"><span class="linenos">810</span></a>                    <span class="nb">print</span><span class="p">(</span><span class="n">arr</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">end</span><span class="o">=</span><span class="s1">&#39;, &#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.print_dataset-811"><a href="#CategoricalClassification.print_dataset-811"><span class="linenos">811</span></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;], Label: </span><span class="si">{</span><span class="n">y</span><span class="p">[</span><span class="n">n</span><span class="p">]</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="CategoricalClassification.print_dataset-812"><a href="#CategoricalClassification.print_dataset-812"><span class="linenos">812</span></a>            <span class="n">n</span> <span class="o">+=</span> <span class="mi">1</span>
 </span></pre></div>
 
 
@@ -2583,67 +2558,6 @@ <h6 id="returns">Returns</h6>
 </div>
 
 
-                            </div>
-                            <div id="CategoricalClassification.summarize" class="classattr">
-                                        <input id="CategoricalClassification.summarize-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
-<div class="attr function">
-            
-        <span class="def">def</span>
-        <span class="name">summarize</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span></span><span class="return-annotation">):</span></span>
-
-                <label class="view-source-button" for="CategoricalClassification.summarize-view-source"><span>View Source</span></label>
-
-    </div>
-    <a class="headerlink" href="#CategoricalClassification.summarize"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="CategoricalClassification.summarize-803"><a href="#CategoricalClassification.summarize-803"><span class="linenos">803</span></a>    <span class="k">def</span> <span class="nf">summarize</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-</span><span id="CategoricalClassification.summarize-804"><a href="#CategoricalClassification.summarize-804"><span class="linenos">804</span></a>
-</span><span id="CategoricalClassification.summarize-805"><a href="#CategoricalClassification.summarize-805"><span class="linenos">805</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of features: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;general&#39;</span><span class="p">][</span><span class="s1">&#39;n_features&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-806"><a href="#CategoricalClassification.summarize-806"><span class="linenos">806</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of generated samples: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;general&#39;</span><span class="p">][</span><span class="s1">&#39;n_samples&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-807"><a href="#CategoricalClassification.summarize-807"><span class="linenos">807</span></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">]:</span>
-</span><span id="CategoricalClassification.summarize-808"><a href="#CategoricalClassification.summarize-808"><span class="linenos">808</span></a>            <span class="nb">print</span><span class="p">(</span>
-</span><span id="CategoricalClassification.summarize-809"><a href="#CategoricalClassification.summarize-809"><span class="linenos">809</span></a>                <span class="sa">f</span><span class="s2">&quot;Dataset downsampled from shape </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">][</span><span class="s1">&#39;original_shape&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">, to shape </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;downsampling&#39;</span><span class="p">][</span><span class="s1">&#39;downsampled_shape&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="CategoricalClassification.summarize-810"><a href="#CategoricalClassification.summarize-810"><span class="linenos">810</span></a>            <span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-811"><a href="#CategoricalClassification.summarize-811"><span class="linenos">811</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of classes: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;labels&#39;</span><span class="p">][</span><span class="s1">&#39;n_class&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-812"><a href="#CategoricalClassification.summarize-812"><span class="linenos">812</span></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Class relation: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;labels&#39;</span><span class="p">][</span><span class="s1">&#39;class_relation&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-813"><a href="#CategoricalClassification.summarize-813"><span class="linenos">813</span></a>
-</span><span id="CategoricalClassification.summarize-814"><a href="#CategoricalClassification.summarize-814"><span class="linenos">814</span></a>        <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-815"><a href="#CategoricalClassification.summarize-815"><span class="linenos">815</span></a>
-</span><span id="CategoricalClassification.summarize-816"><a href="#CategoricalClassification.summarize-816"><span class="linenos">816</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="CategoricalClassification.summarize-817"><a href="#CategoricalClassification.summarize-817"><span class="linenos">817</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Combinations:&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-818"><a href="#CategoricalClassification.summarize-818"><span class="linenos">818</span></a>            <span class="k">for</span> <span class="n">comb</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;combinations&#39;</span><span class="p">]:</span>
-</span><span id="CategoricalClassification.summarize-819"><a href="#CategoricalClassification.summarize-819"><span class="linenos">819</span></a>                <span class="nb">print</span><span class="p">(</span>
-</span><span id="CategoricalClassification.summarize-820"><a href="#CategoricalClassification.summarize-820"><span class="linenos">820</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are in </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;combination_type&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> combination, result in </span><span class="si">{</span><span class="n">comb</span><span class="p">[</span><span class="s1">&#39;combination_ix&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="CategoricalClassification.summarize-821"><a href="#CategoricalClassification.summarize-821"><span class="linenos">821</span></a>                <span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-822"><a href="#CategoricalClassification.summarize-822"><span class="linenos">822</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-823"><a href="#CategoricalClassification.summarize-823"><span class="linenos">823</span></a>
-</span><span id="CategoricalClassification.summarize-824"><a href="#CategoricalClassification.summarize-824"><span class="linenos">824</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="CategoricalClassification.summarize-825"><a href="#CategoricalClassification.summarize-825"><span class="linenos">825</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Correlations:&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-826"><a href="#CategoricalClassification.summarize-826"><span class="linenos">826</span></a>            <span class="k">for</span> <span class="n">corr</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;correlations&#39;</span><span class="p">]:</span>
-</span><span id="CategoricalClassification.summarize-827"><a href="#CategoricalClassification.summarize-827"><span class="linenos">827</span></a>                <span class="nb">print</span><span class="p">(</span>
-</span><span id="CategoricalClassification.summarize-828"><a href="#CategoricalClassification.summarize-828"><span class="linenos">828</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are correlated to </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;correlated_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> with a factor of </span><span class="si">{</span><span class="n">corr</span><span class="p">[</span><span class="s1">&#39;correlation_factor&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="CategoricalClassification.summarize-829"><a href="#CategoricalClassification.summarize-829"><span class="linenos">829</span></a>                <span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-830"><a href="#CategoricalClassification.summarize-830"><span class="linenos">830</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-831"><a href="#CategoricalClassification.summarize-831"><span class="linenos">831</span></a>
-</span><span id="CategoricalClassification.summarize-832"><a href="#CategoricalClassification.summarize-832"><span class="linenos">832</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="CategoricalClassification.summarize-833"><a href="#CategoricalClassification.summarize-833"><span class="linenos">833</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Duplicates:&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-834"><a href="#CategoricalClassification.summarize-834"><span class="linenos">834</span></a>            <span class="k">for</span> <span class="n">dup</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;duplicates&#39;</span><span class="p">]:</span>
-</span><span id="CategoricalClassification.summarize-835"><a href="#CategoricalClassification.summarize-835"><span class="linenos">835</span></a>                <span class="nb">print</span><span class="p">(</span>
-</span><span id="CategoricalClassification.summarize-836"><a href="#CategoricalClassification.summarize-836"><span class="linenos">836</span></a>                    <span class="sa">f</span><span class="s2">&quot;Features </span><span class="si">{</span><span class="n">dup</span><span class="p">[</span><span class="s1">&#39;feature_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> are duplicated, duplicate indexes are </span><span class="si">{</span><span class="n">dup</span><span class="p">[</span><span class="s1">&#39;duplicate_indices&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="CategoricalClassification.summarize-837"><a href="#CategoricalClassification.summarize-837"><span class="linenos">837</span></a>                <span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-838"><a href="#CategoricalClassification.summarize-838"><span class="linenos">838</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-839"><a href="#CategoricalClassification.summarize-839"><span class="linenos">839</span></a>
-</span><span id="CategoricalClassification.summarize-840"><a href="#CategoricalClassification.summarize-840"><span class="linenos">840</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="CategoricalClassification.summarize-841"><a href="#CategoricalClassification.summarize-841"><span class="linenos">841</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;Simulated noise:&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-842"><a href="#CategoricalClassification.summarize-842"><span class="linenos">842</span></a>            <span class="k">for</span> <span class="n">noise</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_info</span><span class="p">[</span><span class="s1">&#39;noise&#39;</span><span class="p">]:</span>
-</span><span id="CategoricalClassification.summarize-843"><a href="#CategoricalClassification.summarize-843"><span class="linenos">843</span></a>                <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Simulated </span><span class="si">{</span><span class="n">noise</span><span class="p">[</span><span class="s1">&#39;type&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2"> noise, amount of </span><span class="si">{</span><span class="n">noise</span><span class="p">[</span><span class="s1">&#39;noise_amount&#39;</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-844"><a href="#CategoricalClassification.summarize-844"><span class="linenos">844</span></a>            <span class="nb">print</span><span class="p">(</span><span class="s1">&#39;-------------------------------------&#39;</span><span class="p">)</span>
-</span><span id="CategoricalClassification.summarize-845"><a href="#CategoricalClassification.summarize-845"><span class="linenos">845</span></a>
-</span><span id="CategoricalClassification.summarize-846"><a href="#CategoricalClassification.summarize-846"><span class="linenos">846</span></a>        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\n</span><span class="s2">For more information on dataset structure, print cc.dataset_info[&#39;general&#39;][&#39;structure&#39;]&quot;</span><span class="p">)</span>
-</span></pre></div>
-
-
-    
-
                             </div>
                 </section>
     </main>
diff --git a/docs/search.js b/docs/search.js
index 871f608..904b8d8 100644
--- a/docs/search.js
+++ b/docs/search.js
@@ -1,6 +1,6 @@
 window.pdocSearch = (function(){
 /** elasticlunr - http://weixsong.github.io * Copyright (C) 2017 Oliver Nightingale * Copyright (C) 2017 Wei Song * MIT Licensed */!function(){function e(e){if(null===e||"object"!=typeof e)return e;var t=e.constructor();for(var n in e)e.hasOwnProperty(n)&&(t[n]=e[n]);return t}var t=function(e){var n=new t.Index;return n.pipeline.add(t.trimmer,t.stopWordFilter,t.stemmer),e&&e.call(n,n),n};t.version="0.9.5",lunr=t,t.utils={},t.utils.warn=function(e){return function(t){e.console&&console.warn&&console.warn(t)}}(this),t.utils.toString=function(e){return void 0===e||null===e?"":e.toString()},t.EventEmitter=function(){this.events={}},t.EventEmitter.prototype.addListener=function(){var e=Array.prototype.slice.call(arguments),t=e.pop(),n=e;if("function"!=typeof t)throw new TypeError("last argument must be a function");n.forEach(function(e){this.hasHandler(e)||(this.events[e]=[]),this.events[e].push(t)},this)},t.EventEmitter.prototype.removeListener=function(e,t){if(this.hasHandler(e)){var n=this.events[e].indexOf(t);-1!==n&&(this.events[e].splice(n,1),0==this.events[e].length&&delete this.events[e])}},t.EventEmitter.prototype.emit=function(e){if(this.hasHandler(e)){var t=Array.prototype.slice.call(arguments,1);this.events[e].forEach(function(e){e.apply(void 0,t)},this)}},t.EventEmitter.prototype.hasHandler=function(e){return e in this.events},t.tokenizer=function(e){if(!arguments.length||null===e||void 0===e)return[];if(Array.isArray(e)){var n=e.filter(function(e){return null===e||void 0===e?!1:!0});n=n.map(function(e){return t.utils.toString(e).toLowerCase()});var i=[];return n.forEach(function(e){var n=e.split(t.tokenizer.seperator);i=i.concat(n)},this),i}return e.toString().trim().toLowerCase().split(t.tokenizer.seperator)},t.tokenizer.defaultSeperator=/[\s\-]+/,t.tokenizer.seperator=t.tokenizer.defaultSeperator,t.tokenizer.setSeperator=function(e){null!==e&&void 0!==e&&"object"==typeof e&&(t.tokenizer.seperator=e)},t.tokenizer.resetSeperator=function(){t.tokenizer.seperator=t.tokenizer.defaultSeperator},t.tokenizer.getSeperator=function(){return t.tokenizer.seperator},t.Pipeline=function(){this._queue=[]},t.Pipeline.registeredFunctions={},t.Pipeline.registerFunction=function(e,n){n in t.Pipeline.registeredFunctions&&t.utils.warn("Overwriting existing registered function: "+n),e.label=n,t.Pipeline.registeredFunctions[n]=e},t.Pipeline.getRegisteredFunction=function(e){return e in t.Pipeline.registeredFunctions!=!0?null:t.Pipeline.registeredFunctions[e]},t.Pipeline.warnIfFunctionNotRegistered=function(e){var n=e.label&&e.label in this.registeredFunctions;n||t.utils.warn("Function is not registered with pipeline. This may cause problems when serialising the index.\n",e)},t.Pipeline.load=function(e){var n=new t.Pipeline;return e.forEach(function(e){var i=t.Pipeline.getRegisteredFunction(e);if(!i)throw new Error("Cannot load un-registered function: "+e);n.add(i)}),n},t.Pipeline.prototype.add=function(){var e=Array.prototype.slice.call(arguments);e.forEach(function(e){t.Pipeline.warnIfFunctionNotRegistered(e),this._queue.push(e)},this)},t.Pipeline.prototype.after=function(e,n){t.Pipeline.warnIfFunctionNotRegistered(n);var i=this._queue.indexOf(e);if(-1===i)throw new Error("Cannot find existingFn");this._queue.splice(i+1,0,n)},t.Pipeline.prototype.before=function(e,n){t.Pipeline.warnIfFunctionNotRegistered(n);var i=this._queue.indexOf(e);if(-1===i)throw new Error("Cannot find existingFn");this._queue.splice(i,0,n)},t.Pipeline.prototype.remove=function(e){var t=this._queue.indexOf(e);-1!==t&&this._queue.splice(t,1)},t.Pipeline.prototype.run=function(e){for(var t=[],n=e.length,i=this._queue.length,o=0;n>o;o++){for(var r=e[o],s=0;i>s&&(r=this._queue[s](r,o,e),void 0!==r&&null!==r);s++);void 0!==r&&null!==r&&t.push(r)}return t},t.Pipeline.prototype.reset=function(){this._queue=[]},t.Pipeline.prototype.get=function(){return this._queue},t.Pipeline.prototype.toJSON=function(){return this._queue.map(function(e){return t.Pipeline.warnIfFunctionNotRegistered(e),e.label})},t.Index=function(){this._fields=[],this._ref="id",this.pipeline=new t.Pipeline,this.documentStore=new t.DocumentStore,this.index={},this.eventEmitter=new t.EventEmitter,this._idfCache={},this.on("add","remove","update",function(){this._idfCache={}}.bind(this))},t.Index.prototype.on=function(){var e=Array.prototype.slice.call(arguments);return this.eventEmitter.addListener.apply(this.eventEmitter,e)},t.Index.prototype.off=function(e,t){return this.eventEmitter.removeListener(e,t)},t.Index.load=function(e){e.version!==t.version&&t.utils.warn("version mismatch: current "+t.version+" importing "+e.version);var n=new this;n._fields=e.fields,n._ref=e.ref,n.documentStore=t.DocumentStore.load(e.documentStore),n.pipeline=t.Pipeline.load(e.pipeline),n.index={};for(var i in e.index)n.index[i]=t.InvertedIndex.load(e.index[i]);return n},t.Index.prototype.addField=function(e){return this._fields.push(e),this.index[e]=new t.InvertedIndex,this},t.Index.prototype.setRef=function(e){return this._ref=e,this},t.Index.prototype.saveDocument=function(e){return this.documentStore=new t.DocumentStore(e),this},t.Index.prototype.addDoc=function(e,n){if(e){var n=void 0===n?!0:n,i=e[this._ref];this.documentStore.addDoc(i,e),this._fields.forEach(function(n){var o=this.pipeline.run(t.tokenizer(e[n]));this.documentStore.addFieldLength(i,n,o.length);var r={};o.forEach(function(e){e in r?r[e]+=1:r[e]=1},this);for(var s in r){var u=r[s];u=Math.sqrt(u),this.index[n].addToken(s,{ref:i,tf:u})}},this),n&&this.eventEmitter.emit("add",e,this)}},t.Index.prototype.removeDocByRef=function(e){if(e&&this.documentStore.isDocStored()!==!1&&this.documentStore.hasDoc(e)){var t=this.documentStore.getDoc(e);this.removeDoc(t,!1)}},t.Index.prototype.removeDoc=function(e,n){if(e){var n=void 0===n?!0:n,i=e[this._ref];this.documentStore.hasDoc(i)&&(this.documentStore.removeDoc(i),this._fields.forEach(function(n){var o=this.pipeline.run(t.tokenizer(e[n]));o.forEach(function(e){this.index[n].removeToken(e,i)},this)},this),n&&this.eventEmitter.emit("remove",e,this))}},t.Index.prototype.updateDoc=function(e,t){var t=void 0===t?!0:t;this.removeDocByRef(e[this._ref],!1),this.addDoc(e,!1),t&&this.eventEmitter.emit("update",e,this)},t.Index.prototype.idf=function(e,t){var n="@"+t+"/"+e;if(Object.prototype.hasOwnProperty.call(this._idfCache,n))return this._idfCache[n];var i=this.index[t].getDocFreq(e),o=1+Math.log(this.documentStore.length/(i+1));return this._idfCache[n]=o,o},t.Index.prototype.getFields=function(){return this._fields.slice()},t.Index.prototype.search=function(e,n){if(!e)return[];e="string"==typeof e?{any:e}:JSON.parse(JSON.stringify(e));var i=null;null!=n&&(i=JSON.stringify(n));for(var o=new t.Configuration(i,this.getFields()).get(),r={},s=Object.keys(e),u=0;u<s.length;u++){var a=s[u];r[a]=this.pipeline.run(t.tokenizer(e[a]))}var l={};for(var c in o){var d=r[c]||r.any;if(d){var f=this.fieldSearch(d,c,o),h=o[c].boost;for(var p in f)f[p]=f[p]*h;for(var p in f)p in l?l[p]+=f[p]:l[p]=f[p]}}var v,g=[];for(var p in l)v={ref:p,score:l[p]},this.documentStore.hasDoc(p)&&(v.doc=this.documentStore.getDoc(p)),g.push(v);return g.sort(function(e,t){return t.score-e.score}),g},t.Index.prototype.fieldSearch=function(e,t,n){var i=n[t].bool,o=n[t].expand,r=n[t].boost,s=null,u={};return 0!==r?(e.forEach(function(e){var n=[e];1==o&&(n=this.index[t].expandToken(e));var r={};n.forEach(function(n){var o=this.index[t].getDocs(n),a=this.idf(n,t);if(s&&"AND"==i){var l={};for(var c in s)c in o&&(l[c]=o[c]);o=l}n==e&&this.fieldSearchStats(u,n,o);for(var c in o){var d=this.index[t].getTermFrequency(n,c),f=this.documentStore.getFieldLength(c,t),h=1;0!=f&&(h=1/Math.sqrt(f));var p=1;n!=e&&(p=.15*(1-(n.length-e.length)/n.length));var v=d*a*h*p;c in r?r[c]+=v:r[c]=v}},this),s=this.mergeScores(s,r,i)},this),s=this.coordNorm(s,u,e.length)):void 0},t.Index.prototype.mergeScores=function(e,t,n){if(!e)return t;if("AND"==n){var i={};for(var o in t)o in e&&(i[o]=e[o]+t[o]);return i}for(var o in t)o in e?e[o]+=t[o]:e[o]=t[o];return e},t.Index.prototype.fieldSearchStats=function(e,t,n){for(var i in n)i in e?e[i].push(t):e[i]=[t]},t.Index.prototype.coordNorm=function(e,t,n){for(var i in e)if(i in t){var o=t[i].length;e[i]=e[i]*o/n}return e},t.Index.prototype.toJSON=function(){var e={};return this._fields.forEach(function(t){e[t]=this.index[t].toJSON()},this),{version:t.version,fields:this._fields,ref:this._ref,documentStore:this.documentStore.toJSON(),index:e,pipeline:this.pipeline.toJSON()}},t.Index.prototype.use=function(e){var t=Array.prototype.slice.call(arguments,1);t.unshift(this),e.apply(this,t)},t.DocumentStore=function(e){this._save=null===e||void 0===e?!0:e,this.docs={},this.docInfo={},this.length=0},t.DocumentStore.load=function(e){var t=new this;return t.length=e.length,t.docs=e.docs,t.docInfo=e.docInfo,t._save=e.save,t},t.DocumentStore.prototype.isDocStored=function(){return this._save},t.DocumentStore.prototype.addDoc=function(t,n){this.hasDoc(t)||this.length++,this.docs[t]=this._save===!0?e(n):null},t.DocumentStore.prototype.getDoc=function(e){return this.hasDoc(e)===!1?null:this.docs[e]},t.DocumentStore.prototype.hasDoc=function(e){return e in this.docs},t.DocumentStore.prototype.removeDoc=function(e){this.hasDoc(e)&&(delete this.docs[e],delete this.docInfo[e],this.length--)},t.DocumentStore.prototype.addFieldLength=function(e,t,n){null!==e&&void 0!==e&&0!=this.hasDoc(e)&&(this.docInfo[e]||(this.docInfo[e]={}),this.docInfo[e][t]=n)},t.DocumentStore.prototype.updateFieldLength=function(e,t,n){null!==e&&void 0!==e&&0!=this.hasDoc(e)&&this.addFieldLength(e,t,n)},t.DocumentStore.prototype.getFieldLength=function(e,t){return null===e||void 0===e?0:e in this.docs&&t in this.docInfo[e]?this.docInfo[e][t]:0},t.DocumentStore.prototype.toJSON=function(){return{docs:this.docs,docInfo:this.docInfo,length:this.length,save:this._save}},t.stemmer=function(){var e={ational:"ate",tional:"tion",enci:"ence",anci:"ance",izer:"ize",bli:"ble",alli:"al",entli:"ent",eli:"e",ousli:"ous",ization:"ize",ation:"ate",ator:"ate",alism:"al",iveness:"ive",fulness:"ful",ousness:"ous",aliti:"al",iviti:"ive",biliti:"ble",logi:"log"},t={icate:"ic",ative:"",alize:"al",iciti:"ic",ical:"ic",ful:"",ness:""},n="[^aeiou]",i="[aeiouy]",o=n+"[^aeiouy]*",r=i+"[aeiou]*",s="^("+o+")?"+r+o,u="^("+o+")?"+r+o+"("+r+")?$",a="^("+o+")?"+r+o+r+o,l="^("+o+")?"+i,c=new RegExp(s),d=new RegExp(a),f=new RegExp(u),h=new RegExp(l),p=/^(.+?)(ss|i)es$/,v=/^(.+?)([^s])s$/,g=/^(.+?)eed$/,m=/^(.+?)(ed|ing)$/,y=/.$/,S=/(at|bl|iz)$/,x=new RegExp("([^aeiouylsz])\\1$"),w=new RegExp("^"+o+i+"[^aeiouwxy]$"),I=/^(.+?[^aeiou])y$/,b=/^(.+?)(ational|tional|enci|anci|izer|bli|alli|entli|eli|ousli|ization|ation|ator|alism|iveness|fulness|ousness|aliti|iviti|biliti|logi)$/,E=/^(.+?)(icate|ative|alize|iciti|ical|ful|ness)$/,D=/^(.+?)(al|ance|ence|er|ic|able|ible|ant|ement|ment|ent|ou|ism|ate|iti|ous|ive|ize)$/,F=/^(.+?)(s|t)(ion)$/,_=/^(.+?)e$/,P=/ll$/,k=new RegExp("^"+o+i+"[^aeiouwxy]$"),z=function(n){var i,o,r,s,u,a,l;if(n.length<3)return n;if(r=n.substr(0,1),"y"==r&&(n=r.toUpperCase()+n.substr(1)),s=p,u=v,s.test(n)?n=n.replace(s,"$1$2"):u.test(n)&&(n=n.replace(u,"$1$2")),s=g,u=m,s.test(n)){var z=s.exec(n);s=c,s.test(z[1])&&(s=y,n=n.replace(s,""))}else if(u.test(n)){var z=u.exec(n);i=z[1],u=h,u.test(i)&&(n=i,u=S,a=x,l=w,u.test(n)?n+="e":a.test(n)?(s=y,n=n.replace(s,"")):l.test(n)&&(n+="e"))}if(s=I,s.test(n)){var z=s.exec(n);i=z[1],n=i+"i"}if(s=b,s.test(n)){var z=s.exec(n);i=z[1],o=z[2],s=c,s.test(i)&&(n=i+e[o])}if(s=E,s.test(n)){var z=s.exec(n);i=z[1],o=z[2],s=c,s.test(i)&&(n=i+t[o])}if(s=D,u=F,s.test(n)){var z=s.exec(n);i=z[1],s=d,s.test(i)&&(n=i)}else if(u.test(n)){var z=u.exec(n);i=z[1]+z[2],u=d,u.test(i)&&(n=i)}if(s=_,s.test(n)){var z=s.exec(n);i=z[1],s=d,u=f,a=k,(s.test(i)||u.test(i)&&!a.test(i))&&(n=i)}return s=P,u=d,s.test(n)&&u.test(n)&&(s=y,n=n.replace(s,"")),"y"==r&&(n=r.toLowerCase()+n.substr(1)),n};return z}(),t.Pipeline.registerFunction(t.stemmer,"stemmer"),t.stopWordFilter=function(e){return e&&t.stopWordFilter.stopWords[e]!==!0?e:void 0},t.clearStopWords=function(){t.stopWordFilter.stopWords={}},t.addStopWords=function(e){null!=e&&Array.isArray(e)!==!1&&e.forEach(function(e){t.stopWordFilter.stopWords[e]=!0},this)},t.resetStopWords=function(){t.stopWordFilter.stopWords=t.defaultStopWords},t.defaultStopWords={"":!0,a:!0,able:!0,about:!0,across:!0,after:!0,all:!0,almost:!0,also:!0,am:!0,among:!0,an:!0,and:!0,any:!0,are:!0,as:!0,at:!0,be:!0,because:!0,been:!0,but:!0,by:!0,can:!0,cannot:!0,could:!0,dear:!0,did:!0,"do":!0,does:!0,either:!0,"else":!0,ever:!0,every:!0,"for":!0,from:!0,get:!0,got:!0,had:!0,has:!0,have:!0,he:!0,her:!0,hers:!0,him:!0,his:!0,how:!0,however:!0,i:!0,"if":!0,"in":!0,into:!0,is:!0,it:!0,its:!0,just:!0,least:!0,let:!0,like:!0,likely:!0,may:!0,me:!0,might:!0,most:!0,must:!0,my:!0,neither:!0,no:!0,nor:!0,not:!0,of:!0,off:!0,often:!0,on:!0,only:!0,or:!0,other:!0,our:!0,own:!0,rather:!0,said:!0,say:!0,says:!0,she:!0,should:!0,since:!0,so:!0,some:!0,than:!0,that:!0,the:!0,their:!0,them:!0,then:!0,there:!0,these:!0,they:!0,"this":!0,tis:!0,to:!0,too:!0,twas:!0,us:!0,wants:!0,was:!0,we:!0,were:!0,what:!0,when:!0,where:!0,which:!0,"while":!0,who:!0,whom:!0,why:!0,will:!0,"with":!0,would:!0,yet:!0,you:!0,your:!0},t.stopWordFilter.stopWords=t.defaultStopWords,t.Pipeline.registerFunction(t.stopWordFilter,"stopWordFilter"),t.trimmer=function(e){if(null===e||void 0===e)throw new Error("token should not be undefined");return e.replace(/^\W+/,"").replace(/\W+$/,"")},t.Pipeline.registerFunction(t.trimmer,"trimmer"),t.InvertedIndex=function(){this.root={docs:{},df:0}},t.InvertedIndex.load=function(e){var t=new this;return t.root=e.root,t},t.InvertedIndex.prototype.addToken=function(e,t,n){for(var n=n||this.root,i=0;i<=e.length-1;){var o=e[i];o in n||(n[o]={docs:{},df:0}),i+=1,n=n[o]}var r=t.ref;n.docs[r]?n.docs[r]={tf:t.tf}:(n.docs[r]={tf:t.tf},n.df+=1)},t.InvertedIndex.prototype.hasToken=function(e){if(!e)return!1;for(var t=this.root,n=0;n<e.length;n++){if(!t[e[n]])return!1;t=t[e[n]]}return!0},t.InvertedIndex.prototype.getNode=function(e){if(!e)return null;for(var t=this.root,n=0;n<e.length;n++){if(!t[e[n]])return null;t=t[e[n]]}return t},t.InvertedIndex.prototype.getDocs=function(e){var t=this.getNode(e);return null==t?{}:t.docs},t.InvertedIndex.prototype.getTermFrequency=function(e,t){var n=this.getNode(e);return null==n?0:t in n.docs?n.docs[t].tf:0},t.InvertedIndex.prototype.getDocFreq=function(e){var t=this.getNode(e);return null==t?0:t.df},t.InvertedIndex.prototype.removeToken=function(e,t){if(e){var n=this.getNode(e);null!=n&&t in n.docs&&(delete n.docs[t],n.df-=1)}},t.InvertedIndex.prototype.expandToken=function(e,t,n){if(null==e||""==e)return[];var t=t||[];if(void 0==n&&(n=this.getNode(e),null==n))return t;n.df>0&&t.push(e);for(var i in n)"docs"!==i&&"df"!==i&&this.expandToken(e+i,t,n[i]);return t},t.InvertedIndex.prototype.toJSON=function(){return{root:this.root}},t.Configuration=function(e,n){var e=e||"";if(void 0==n||null==n)throw new Error("fields should not be null");this.config={};var i;try{i=JSON.parse(e),this.buildUserConfig(i,n)}catch(o){t.utils.warn("user configuration parse failed, will use default configuration"),this.buildDefaultConfig(n)}},t.Configuration.prototype.buildDefaultConfig=function(e){this.reset(),e.forEach(function(e){this.config[e]={boost:1,bool:"OR",expand:!1}},this)},t.Configuration.prototype.buildUserConfig=function(e,n){var i="OR",o=!1;if(this.reset(),"bool"in e&&(i=e.bool||i),"expand"in e&&(o=e.expand||o),"fields"in e)for(var r in e.fields)if(n.indexOf(r)>-1){var s=e.fields[r],u=o;void 0!=s.expand&&(u=s.expand),this.config[r]={boost:s.boost||0===s.boost?s.boost:1,bool:s.bool||i,expand:u}}else t.utils.warn("field name in user configuration not found in index instance fields");else this.addAllFields2UserConfig(i,o,n)},t.Configuration.prototype.addAllFields2UserConfig=function(e,t,n){n.forEach(function(n){this.config[n]={boost:1,bool:e,expand:t}},this)},t.Configuration.prototype.get=function(){return this.config},t.Configuration.prototype.reset=function(){this.config={}},lunr.SortedSet=function(){this.length=0,this.elements=[]},lunr.SortedSet.load=function(e){var t=new this;return t.elements=e,t.length=e.length,t},lunr.SortedSet.prototype.add=function(){var e,t;for(e=0;e<arguments.length;e++)t=arguments[e],~this.indexOf(t)||this.elements.splice(this.locationFor(t),0,t);this.length=this.elements.length},lunr.SortedSet.prototype.toArray=function(){return this.elements.slice()},lunr.SortedSet.prototype.map=function(e,t){return this.elements.map(e,t)},lunr.SortedSet.prototype.forEach=function(e,t){return this.elements.forEach(e,t)},lunr.SortedSet.prototype.indexOf=function(e){for(var t=0,n=this.elements.length,i=n-t,o=t+Math.floor(i/2),r=this.elements[o];i>1;){if(r===e)return o;e>r&&(t=o),r>e&&(n=o),i=n-t,o=t+Math.floor(i/2),r=this.elements[o]}return r===e?o:-1},lunr.SortedSet.prototype.locationFor=function(e){for(var t=0,n=this.elements.length,i=n-t,o=t+Math.floor(i/2),r=this.elements[o];i>1;)e>r&&(t=o),r>e&&(n=o),i=n-t,o=t+Math.floor(i/2),r=this.elements[o];return r>e?o:e>r?o+1:void 0},lunr.SortedSet.prototype.intersect=function(e){for(var t=new lunr.SortedSet,n=0,i=0,o=this.length,r=e.length,s=this.elements,u=e.elements;;){if(n>o-1||i>r-1)break;s[n]!==u[i]?s[n]<u[i]?n++:s[n]>u[i]&&i++:(t.add(s[n]),n++,i++)}return t},lunr.SortedSet.prototype.clone=function(){var e=new lunr.SortedSet;return e.elements=this.toArray(),e.length=e.elements.length,e},lunr.SortedSet.prototype.union=function(e){var t,n,i;this.length>=e.length?(t=this,n=e):(t=e,n=this),i=t.clone();for(var o=0,r=n.toArray();o<r.length;o++)i.add(r[o]);return i},lunr.SortedSet.prototype.toJSON=function(){return this.toArray()},function(e,t){"function"==typeof define&&define.amd?define(t):"object"==typeof exports?module.exports=t():e.elasticlunr=t()}(this,function(){return t})}();
-    /** pdoc search index */const docs = [{"fullname": "outrank", "modulename": "outrank", "kind": "module", "doc": "<h1 id=\"welcome-to-outranks-documentation\">Welcome to OutRank's documentation!</h1>\n\n<p>All functions/methods can be searched-for (search bar on the left).</p>\n\n<p>This tool enables fast screening of feature-feature interactions. Its purpose is to give the user fast insight into potential redundancies/anomalies in the data.\nIt is implemented to operate in _mini batches_, it traverses the <code>raw data</code> incrementally, refining the rankings as it goes along. The core operation, interaction ranking, outputs triplets which look as follows:</p>\n\n<pre><code>featureA    featureB    0.512\nfeatureA    featureC    0.125\n</code></pre>\n\n<h1 id=\"setup\">Setup</h1>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code>pip<span class=\"w\"> </span>install<span class=\"w\"> </span>outrank\n</code></pre>\n</div>\n\n<p>and test a minimal cycle with</p>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code>outrank<span class=\"w\"> </span>--task<span class=\"w\"> </span>selftest\n</code></pre>\n</div>\n\n<p>if this passes, you can be pretty certain OutRank will perform as intended. OutRank's primary use case is as a CLI tool, begin exploring with</p>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code>outrank<span class=\"w\"> </span>--help\n</code></pre>\n</div>\n\n<h1 id=\"example-use-cases\">Example use cases</h1>\n\n<ul>\n<li><p>A minimal showcase of performing feature ranking on a generic CSV is demonstrated with <a href=\"https://github.com/outbrain/outrank/tree/main/scripts/run_minimal.sh\">this example</a>.</p></li>\n<li><p><a href=\"https://github.com/outbrain/outrank/tree/main/examples\">More examples</a> demonstrating OutRank's capabilities are also available.</p></li>\n</ul>\n\n<h1 id=\"outrank-as-a-python-library\">OutRank as a Python library</h1>\n\n<p>Once installed, _OutRank_ can be used as any other Python library. For example, generic feature ranking algorithms can be accessed as</p>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"kn\">from</span> <span class=\"nn\">outrank.algorithms.feature_ranking.ranking_mi_numba</span> <span class=\"kn\">import</span> <span class=\"p\">(</span>\n    <span class=\"n\">mutual_info_estimator_numba</span><span class=\"p\">,</span>\n<span class=\"p\">)</span>\n\n<span class=\"c1\"># Some synthetic minimal data (Numpy vectors)</span>\n<span class=\"n\">a</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">([</span><span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">],</span> <span class=\"n\">dtype</span><span class=\"o\">=</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">int32</span><span class=\"p\">)</span>\n\n<span class=\"n\">lowest</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">(</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">random</span><span class=\"o\">.</span><span class=\"n\">permutation</span><span class=\"p\">(</span><span class=\"n\">a</span><span class=\"p\">),</span> <span class=\"n\">dtype</span><span class=\"o\">=</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">int32</span><span class=\"p\">)</span>\n<span class=\"n\">medium</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">([</span><span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">],</span> <span class=\"n\">dtype</span><span class=\"o\">=</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">int32</span><span class=\"p\">)</span>\n<span class=\"n\">high</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">([</span><span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">],</span> <span class=\"n\">dtype</span><span class=\"o\">=</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">int32</span><span class=\"p\">)</span>\n\n<span class=\"n\">lowest_score</span> <span class=\"o\">=</span> <span class=\"n\">mutual_info_estimator_numba</span><span class=\"p\">(</span>\n    <span class=\"n\">a</span><span class=\"p\">,</span> <span class=\"n\">lowest</span><span class=\"p\">,</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">float32</span><span class=\"p\">(</span><span class=\"mf\">1.0</span><span class=\"p\">),</span> <span class=\"kc\">False</span><span class=\"p\">,</span>\n<span class=\"p\">)</span>\n<span class=\"n\">medium_score</span> <span class=\"o\">=</span> <span class=\"n\">mutual_info_estimator_numba</span><span class=\"p\">(</span>\n    <span class=\"n\">a</span><span class=\"p\">,</span> <span class=\"n\">medium</span><span class=\"p\">,</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">float32</span><span class=\"p\">(</span><span class=\"mf\">1.0</span><span class=\"p\">),</span> <span class=\"kc\">False</span><span class=\"p\">,</span>\n<span class=\"p\">)</span>\n<span class=\"n\">high_score</span> <span class=\"o\">=</span> <span class=\"n\">mutual_info_estimator_numba</span><span class=\"p\">(</span>\n    <span class=\"n\">a</span><span class=\"p\">,</span> <span class=\"n\">high</span><span class=\"p\">,</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">float32</span><span class=\"p\">(</span><span class=\"mf\">1.0</span><span class=\"p\">),</span> <span class=\"kc\">False</span><span class=\"p\">,</span>\n<span class=\"p\">)</span>\n\n<span class=\"n\">scores</span> <span class=\"o\">=</span> <span class=\"p\">[</span><span class=\"n\">lowest_score</span><span class=\"p\">,</span> <span class=\"n\">medium_score</span><span class=\"p\">,</span> <span class=\"n\">high_score</span><span class=\"p\">]</span>\n<span class=\"n\">sorted_score_indices</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">argsort</span><span class=\"p\">(</span><span class=\"n\">scores</span><span class=\"p\">)</span>\n<span class=\"k\">assert</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">sum</span><span class=\"p\">(</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">([</span><span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">2</span><span class=\"p\">])</span> <span class=\"o\">-</span> <span class=\"n\">sorted_score_indices</span><span class=\"p\">)</span> <span class=\"o\">==</span>  <span class=\"mi\">0</span>\n</code></pre>\n</div>\n\n<hr />\n\n<h2 id=\"creating-a-simple-dataset\">Creating a simple dataset</h2>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"kn\">from</span> <span class=\"nn\">outrank.algorithms.synthetic_data_generators.cc_generator</span> <span class=\"kn\">import</span> <span class=\"n\">CategoricalClassification</span>\n\n<span class=\"n\">cc</span> <span class=\"o\">=</span> <span class=\"n\">CategoricalClassification</span><span class=\"p\">()</span>\n\n<span class=\"c1\"># Creates a simple dataset of 10 features, 10k samples, with feature cardinality of all features being 35</span>\n<span class=\"n\">X</span> <span class=\"o\">=</span> <span class=\"n\">cc</span><span class=\"o\">.</span><span class=\"n\">generate_data</span><span class=\"p\">(</span><span class=\"mi\">9</span><span class=\"p\">,</span> \n                     <span class=\"mi\">10000</span><span class=\"p\">,</span> \n                     <span class=\"n\">cardinality</span><span class=\"o\">=</span><span class=\"mi\">35</span><span class=\"p\">,</span> \n                     <span class=\"n\">ensure_rep</span><span class=\"o\">=</span><span class=\"kc\">True</span><span class=\"p\">,</span> \n                     <span class=\"n\">random_values</span><span class=\"o\">=</span><span class=\"kc\">True</span><span class=\"p\">,</span> \n                     <span class=\"n\">low</span><span class=\"o\">=</span><span class=\"mi\">0</span><span class=\"p\">,</span> \n                     <span class=\"n\">high</span><span class=\"o\">=</span><span class=\"mi\">40</span><span class=\"p\">)</span>\n\n<span class=\"c1\"># Creates target labels via clustering</span>\n<span class=\"n\">y</span> <span class=\"o\">=</span> <span class=\"n\">cc</span><span class=\"o\">.</span><span class=\"n\">generate_labels</span><span class=\"p\">(</span><span class=\"n\">X</span><span class=\"p\">,</span> <span class=\"n\">n</span><span class=\"o\">=</span><span class=\"mi\">2</span><span class=\"p\">,</span> <span class=\"n\">class_relation</span><span class=\"o\">=</span><span class=\"s1\">&#39;cluster&#39;</span><span class=\"p\">)</span>\n</code></pre>\n</div>\n"}, {"fullname": "outrank.algorithms", "modulename": "outrank.algorithms", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.feature_ranking", "modulename": "outrank.algorithms.feature_ranking", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "numba_unique", "kind": "function", "doc": "<p>Identify unique elements in an array, fast</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">a</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "compute_conditional_entropy", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">Y_classes</span>,</span><span class=\"param\">\t<span class=\"n\">class_values</span>,</span><span class=\"param\">\t<span class=\"n\">class_var_shape</span>,</span><span class=\"param\">\t<span class=\"n\">initial_prob</span>,</span><span class=\"param\">\t<span class=\"n\">nonzero_counts</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "compute_entropies", "kind": "function", "doc": "<p>Core entropy computation function</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">X</span>, </span><span class=\"param\"><span class=\"n\">Y</span>, </span><span class=\"param\"><span class=\"n\">all_events</span>, </span><span class=\"param\"><span class=\"n\">f_values</span>, </span><span class=\"param\"><span class=\"n\">f_value_counts</span>, </span><span class=\"param\"><span class=\"n\">cardinality_correction</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "stratified_subsampling", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">Y</span>, </span><span class=\"param\"><span class=\"n\">X</span>, </span><span class=\"param\"><span class=\"n\">approximation_factor</span>, </span><span class=\"param\"><span class=\"n\">_f_values_X</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "mutual_info_estimator_numba", "kind": "function", "doc": "<p>Core estimator logic. Compute unique elements, subset if required</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">Y</span>, </span><span class=\"param\"><span class=\"n\">X</span>, </span><span class=\"param\"><span class=\"n\">approximation_factor</span><span class=\"o\">=</span><span class=\"mf\">1.0</span>, </span><span class=\"param\"><span class=\"n\">cardinality_correction</span><span class=\"o\">=</span><span class=\"kc\">False</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator", "modulename": "outrank.algorithms.importance_estimator", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.importance_estimator.logger", "modulename": "outrank.algorithms.importance_estimator", "qualname": "logger", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;Logger syn-logger (DEBUG)&gt;"}, {"fullname": "outrank.algorithms.importance_estimator.num_folds", "modulename": "outrank.algorithms.importance_estimator", "qualname": "num_folds", "kind": "variable", "doc": "<p></p>\n", "default_value": "4"}, {"fullname": "outrank.algorithms.importance_estimator.sklearn_MI", "modulename": "outrank.algorithms.importance_estimator", "qualname": "sklearn_MI", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">vector_first</span><span class=\"p\">:</span> <span class=\"n\">Any</span>, </span><span class=\"param\"><span class=\"n\">vector_second</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">float</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.sklearn_surrogate", "modulename": "outrank.algorithms.importance_estimator", "qualname": "sklearn_surrogate", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">vector_first</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">vector_second</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">surrogate_model</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">float</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.numba_mi", "modulename": "outrank.algorithms.importance_estimator", "qualname": "numba_mi", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">vector_first</span>, </span><span class=\"param\"><span class=\"n\">vector_second</span>, </span><span class=\"param\"><span class=\"n\">heuristic</span>, </span><span class=\"param\"><span class=\"n\">mi_stratified_sampling_ratio</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.sklearn_mi_adj", "modulename": "outrank.algorithms.importance_estimator", "qualname": "sklearn_mi_adj", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">vector_first</span>, </span><span class=\"param\"><span class=\"n\">vector_second</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise", "modulename": "outrank.algorithms.importance_estimator", "qualname": "get_importances_estimate_pairwise", "kind": "function", "doc": "<p>A method for parallel importances estimation. As interaction scoring is independent, individual scores can be computed in parallel.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">combination</span>, </span><span class=\"param\"><span class=\"n\">reference_model_features</span>, </span><span class=\"param\"><span class=\"n\">args</span>, </span><span class=\"param\"><span class=\"n\">tmp_df</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.rank_features_3MR", "modulename": "outrank.algorithms.importance_estimator", "qualname": "rank_features_3MR", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">relevance_dict</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">redundancy_dict</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">relational_dict</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">strategy</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;median&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">alpha</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mi\">1</span>,</span><span class=\"param\">\t<span class=\"n\">beta</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mi\">1</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic", "modulename": "outrank.algorithms.importance_estimator", "qualname": "get_importances_estimate_nonmyopic", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>, </span><span class=\"param\"><span class=\"n\">tmp_df</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.initialize_classifier", "modulename": "outrank.algorithms.importance_estimator", "qualname": "initialize_classifier", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">surrogate_model</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches", "modulename": "outrank.algorithms.sketches", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms", "modulename": "outrank.algorithms.sketches.counting_cms", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.cms_hash", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "cms_hash", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">x</span>, </span><span class=\"param\"><span class=\"n\">seed</span>, </span><span class=\"param\"><span class=\"n\">width</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch", "kind": "class", "doc": "<p>A memory-efficient implementation of the count min sketch algorithm with optimized hashing using Numba JIT.</p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">depth</span><span class=\"o\">=</span><span class=\"mi\">6</span>, </span><span class=\"param\"><span class=\"n\">width</span><span class=\"o\">=</span><span class=\"mi\">32768</span>, </span><span class=\"param\"><span class=\"n\">M</span><span class=\"o\">=</span><span class=\"kc\">None</span></span>)</span>"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.depth", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.depth", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.width", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.width", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.hash_seeds", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.M", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.M", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.add", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">x</span>, </span><span class=\"param\"><span class=\"n\">delta</span><span class=\"o\">=</span><span class=\"mi\">1</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.batch_add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">lst</span>, </span><span class=\"param\"><span class=\"n\">delta</span><span class=\"o\">=</span><span class=\"mi\">1</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.query", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.query", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">x</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.get_matrix", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter", "kind": "class", "doc": "<p>A memory-efficient implementation of the count min sketch algorithm with optimized hashing using Numba JIT.</p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">bound</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">30000</span></span>)</span>"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.max_bound_thr", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.default_counter", "kind": "variable", "doc": "<p></p>\n", "annotation": ": collections.Counter"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.batch_add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">lst</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">val</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "kind": "module", "doc": "<p>This module implements probabilistic data structure which is able to calculate the cardinality of large multisets in a single pass using little auxiliary memory</p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache", "kind": "class", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">error_rate</span><span class=\"o\">=</span><span class=\"mf\">0.005</span></span>)</span>"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.p", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.p", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.m", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.m", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.warmup_set", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.warmup_size", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.width", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.width", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.hll_flag", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">value</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators", "modulename": "outrank.algorithms.synthetic_data_generators", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification", "kind": "class", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.dataset_info", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.dataset_info", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_data", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_data", "kind": "function", "doc": "<p>Generates dataset based on given parameters</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>n_features</strong>:  number of generated features</li>\n<li><strong>n_samples</strong>:  number of generated samples</li>\n<li><strong>cardinality</strong>:  default cardinality of the dataset</li>\n<li><strong>structure</strong>:  structure of the dataset</li>\n<li><strong>ensure_rep</strong>:  flag, ensures all given values represented</li>\n<li><strong>random_values</strong>:  flag, enables random (integer) feature values from set [low, high]</li>\n<li><strong>low</strong>:  sets lower bound of random feature values</li>\n<li><strong>high</strong>:  sets high bound of random feature values</li>\n<li><strong>seed</strong>:  sets seed of numpy random</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>X, 2D dataset</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">n_features</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">n_samples</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">cardinality</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">5</span>,</span><span class=\"param\">\t<span class=\"n\">structure</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]],</span> <span class=\"n\">NoneType</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">ensure_rep</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">random_values</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">low</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"mi\">0</span>,</span><span class=\"param\">\t<span class=\"n\">high</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"mi\">1000</span>,</span><span class=\"param\">\t<span class=\"n\">seed</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">42</span></span><span class=\"return-annotation\">) -> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_combinations", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_combinations", "kind": "function", "doc": "<p>Generates linear, nonlinear, or custom combinations within feature vectors in given dataset X</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset</li>\n<li><strong>feature_indices</strong>:  indexes of features to be in combination</li>\n<li><strong>combination_function</strong>:  optional custom function for combining feature vectors</li>\n<li><strong>combination_type</strong>:  string flag, either liner or nonlinear, defining combination type</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>X with added resultant feature</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">feature_indices</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">combination_function</span><span class=\"p\">:</span> <span class=\"n\">Optional</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">combination_type</span><span class=\"p\">:</span> <span class=\"n\">Literal</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;linear&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_correlated", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_correlated", "kind": "function", "doc": "<p>Generates correlated features using the given feature indices. Correlation is based on cosine of angle between vectors with mean 0.</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset</li>\n<li><strong>feature_indices</strong>:  indices of features to generate correlated feature to</li>\n<li><strong>r</strong>:  (Pearson) correlation factor</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>X with generated correlated  features</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">feature_indices</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">r</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">0.8</span></span><span class=\"return-annotation\">) -> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_duplicates", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_duplicates", "kind": "function", "doc": "<p>Generates duplicate features</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset</li>\n<li><strong>feature_indices</strong>:  indices of features to duplicate</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>dataset with duplicated features</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">feature_indices</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_labels", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_labels", "kind": "function", "doc": "<p>Generates labels for dataset X</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset</li>\n<li><strong>n</strong>:  number of class labels</li>\n<li><strong>p</strong>:  class distribution</li>\n<li><strong>k</strong>:  constant</li>\n<li><strong>decision_function</strong>:  optional user-defined decision function</li>\n<li><strong>class_relation</strong>:  string, either 'linear', 'nonlinear', or 'cluster'</li>\n<li><strong>balance</strong>:  boolean, whether to balance clustering class labels</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>array of labels, corresponding to dataset X</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">n</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">2</span>,</span><span class=\"param\">\t<span class=\"n\">p</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">float</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span> <span class=\"o\">=</span> <span class=\"mf\">0.5</span>,</span><span class=\"param\">\t<span class=\"n\">k</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">|</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mi\">2</span>,</span><span class=\"param\">\t<span class=\"n\">decision_function</span><span class=\"p\">:</span> <span class=\"n\">Optional</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">class_relation</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;linear&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">balance</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_noise", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_noise", "kind": "function", "doc": "<p>Simulates noise on given dataset X</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset to apply noise to</li>\n<li><strong>y</strong>:  required target labels for categorical noise generation</li>\n<li><strong>p</strong>:  amount of noise to apply. Defaults to 0.2</li>\n<li><strong>type</strong>:  type of noise to apply, either categorical or missing</li>\n<li><strong>missing_val</strong>:  value to simulate missing values. Defaults to float('-inf')</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>X with noise applied</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">y</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">p</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">0.2</span>,</span><span class=\"param\">\t<span class=\"nb\">type</span><span class=\"p\">:</span> <span class=\"n\">Literal</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;categorical&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">missing_val</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">|</span> <span class=\"nb\">int</span> <span class=\"o\">|</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"o\">-</span><span class=\"n\">inf</span></span><span class=\"return-annotation\">) -> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.downsample_dataset", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.downsample_dataset", "kind": "function", "doc": "<p>Downsamples dataset X according to N or the number of samples in minority class, resulting in a balanced dataset.</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  Dataset to downsample</li>\n<li><strong>y</strong>:  Labels corresponding to X</li>\n<li><strong>N</strong>:  Optional number of samples per class to downsample to</li>\n<li><strong>seed</strong>:  Seed for random state of resample function</li>\n<li><strong>reshuffle</strong>:  Reshuffle the dataset after downsampling</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>Balanced X and y after downsampling</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">y</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">N</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">seed</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">42</span>,</span><span class=\"param\">\t<span class=\"n\">reshuffle</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.print_dataset", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.print_dataset", "kind": "function", "doc": "<p>Prints given dataset</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset</li>\n<li><strong>y</strong>:  labels</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">y</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.summarize", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.summarize", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.generator_naive", "modulename": "outrank.algorithms.synthetic_data_generators.generator_naive", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix", "modulename": "outrank.algorithms.synthetic_data_generators.generator_naive", "qualname": "generate_random_matrix", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">num_features</span><span class=\"o\">=</span><span class=\"mi\">100</span>, </span><span class=\"param\"><span class=\"n\">size</span><span class=\"o\">=</span><span class=\"mi\">20000</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking", "modulename": "outrank.core_ranking", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.core_ranking.logger", "modulename": "outrank.core_ranking", "qualname": "logger", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;Logger syn-logger (DEBUG)&gt;"}, {"fullname": "outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE", "modulename": "outrank.core_ranking", "qualname": "GLOBAL_CARDINALITY_STORAGE", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[typing.Any, typing.Any]", "default_value": "{}"}, {"fullname": "outrank.core_ranking.GLOBAL_COUNTS_STORAGE", "modulename": "outrank.core_ranking", "qualname": "GLOBAL_COUNTS_STORAGE", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[typing.Any, typing.Any]", "default_value": "{}"}, {"fullname": "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE", "modulename": "outrank.core_ranking", "qualname": "GLOBAL_RARE_VALUE_STORAGE", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[str, typing.Any]", "default_value": "Counter()"}, {"fullname": "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS", "modulename": "outrank.core_ranking", "qualname": "GLOBAL_PRIOR_COMB_COUNTS", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[typing.Any, int]", "default_value": "Counter()"}, {"fullname": "outrank.core_ranking.IGNORED_VALUES", "modulename": "outrank.core_ranking", "qualname": "IGNORED_VALUES", "kind": "variable", "doc": "<p></p>\n", "default_value": "set()"}, {"fullname": "outrank.core_ranking.HYPERLL_ERROR_BOUND", "modulename": "outrank.core_ranking", "qualname": "HYPERLL_ERROR_BOUND", "kind": "variable", "doc": "<p></p>\n", "default_value": "0.02"}, {"fullname": "outrank.core_ranking.MAX_FEATURES_3MR", "modulename": "outrank.core_ranking", "qualname": "MAX_FEATURES_3MR", "kind": "variable", "doc": "<p></p>\n", "default_value": "10000"}, {"fullname": "outrank.core_ranking.prior_combinations_sample", "modulename": "outrank.core_ranking", "qualname": "prior_combinations_sample", "kind": "function", "doc": "<p>Make sure only relevant subspace of combinations is selected based on prior counts</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">combinations</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.get_combinations_from_columns", "modulename": "outrank.core_ranking", "qualname": "get_combinations_from_columns", "kind": "function", "doc": "<p>Return feature-feature &amp; feature-label combinations, depending on the heuristic and ranking scope</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">all_columns</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">indexes</span><span class=\"o\">.</span><span class=\"n\">base</span><span class=\"o\">.</span><span class=\"n\">Index</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.mixed_rank_graph", "modulename": "outrank.core_ranking", "qualname": "mixed_rank_graph", "kind": "function", "doc": "<p>Compute the full mixed rank graph corresponding to all pairwise feature interactions based on the selected heuristic</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">cpu_pool</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">BatchRankingSummary</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.enrich_with_transformations", "modulename": "outrank.core_ranking", "qualname": "enrich_with_transformations", "kind": "function", "doc": "<p>Construct a collection of new features based on pre-defined transformations/rules</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">num_col_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_combined_features", "modulename": "outrank.core_ranking", "qualname": "compute_combined_features", "kind": "function", "doc": "<p>Compute higher order features via xxhash-based trick.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">is_3mr</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_expanded_multivalue_features", "modulename": "outrank.core_ranking", "qualname": "compute_expanded_multivalue_features", "kind": "function", "doc": "<p>Compute one-hot encoded feature space based on each designated multivalue feature. E.g., feature with value \"a,b,c\" becomes three features, values of which are presence of a given value in a mutlivalue feature of choice.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_subfeatures", "modulename": "outrank.core_ranking", "qualname": "compute_subfeatures", "kind": "function", "doc": "<p>Compute derived features that are more fine-grained. Implements logic around two operators that govern feature construction.\n->: One sided construction - every value from left side is fine, separate ones from the right side feature will be considered.\n&lt;->: Two sided construction - two-sided values present. This means that each value from a is combined with each from b, forming |A|*|B| new features (one-hot encoded)</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.include_noisy_features", "modulename": "outrank.core_ranking", "qualname": "include_noisy_features", "kind": "function", "doc": "<p>Add randomized features that serve as a sanity check</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_coverage", "modulename": "outrank.core_ranking", "qualname": "compute_coverage", "kind": "function", "doc": "<p>Compute coverage of features, incrementally</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_feature_memory_consumption", "modulename": "outrank.core_ranking", "qualname": "compute_feature_memory_consumption", "kind": "function", "doc": "<p>An approximation of how much feature take up</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_value_counts", "modulename": "outrank.core_ranking", "qualname": "compute_value_counts", "kind": "function", "doc": "<p>Update the count structure</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>, </span><span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_cardinalities", "modulename": "outrank.core_ranking", "qualname": "compute_cardinalities", "kind": "function", "doc": "<p>Compute cardinalities of features, incrementally</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">max_unique_hist_constraint</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_bounds_increment", "modulename": "outrank.core_ranking", "qualname": "compute_bounds_increment", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">numeric_column_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_batch_ranking", "modulename": "outrank.core_ranking", "qualname": "compute_batch_ranking", "kind": "function", "doc": "<p>Enrich the feature space and compute the batch importances</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">line_tmp_storage</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">numeric_column_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">cpu_pool</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">column_descriptions</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">BatchRankingSummary</span><span class=\"p\">,</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.get_grouped_df", "modulename": "outrank.core_ranking", "qualname": "get_grouped_df", "kind": "function", "doc": "<p>A helper method that enables median-based aggregation after processing</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">importances_df_list</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.checkpoint_importances_df", "modulename": "outrank.core_ranking", "qualname": "checkpoint_importances_df", "kind": "function", "doc": "<p>A helper which stores intermediary state - useful for longer runs</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">importances_batch</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.estimate_importances_minibatches", "modulename": "outrank.core_ranking", "qualname": "estimate_importances_minibatches", "kind": "function", "doc": "<p>Interaction score estimator - suitable for example for csv-like input data types.\nThis type of data is normally a single large csv, meaning that minibatch processing needs to\nhappen during incremental handling of the file (that\"s not the case for pre-separated ob data)</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_file</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">column_descriptions</span><span class=\"p\">:</span> <span class=\"nb\">list</span>,</span><span class=\"param\">\t<span class=\"n\">fw_col_mapping</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">numeric_column_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span>,</span><span class=\"param\">\t<span class=\"n\">batch_size</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">100000</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">data_encoding</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;utf-8&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">cpu_pool</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;</span><span class=\"se\">\\t</span><span class=\"s1\">&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">feature_construction_mode</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">defaultdict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_selftest", "modulename": "outrank.core_selftest", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.core_utils", "modulename": "outrank.core_utils", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.core_utils.pro_tips", "modulename": "outrank.core_utils", "qualname": "pro_tips", "kind": "variable", "doc": "<p></p>\n", "default_value": "[&#x27;OutRank can construct subfeatures; features based on subspaces. Example command argument is: --subfeature_mapping &quot;feature_a-&gt;feature_b;feature_c&lt;-&gt;feature_d;feature_c&lt;-&gt;feature_e&quot;&#x27;, &#x27;Heuristic MI-numba-randomized seems like the best of both worlds! (speed + performance).&#x27;, &#x27;Heuristic surrogate-lr performs cross-validation (internally), keep that in mind!&#x27;, &#x27;Consider running OutRank on a smaller data sample first, might be enough (--subsampling = a lot).&#x27;, &#x27;There are two types of combinations supported; unsupervised pairwise ranking (redundancies- --target_ranking_only=False), and supervised combinations - (--interaction_order &gt; 1)&#x27;, &#x27;Visualization part also includes clustering - this might be very insightful!&#x27;, &#x27;By default OutRank includes feature cardinality and coverage in feature names (card; cov)&#x27;, &#x27;Intermediary checkpoints (tmp_checkpoint.tsv) might already give you insights during longer runs.&#x27;, &#x27;In theory, you can rank redundancies of combined features (--interaction_order AND --target_ranking_only=False).&#x27;, &#x27;Give it as many threads as physically possible (--num_threads).&#x27;, &#x27;You can speed up ranking by diminishing feature buffer size (--combination_number_upper_bound determines how many ranking computations per batch will be considered). This, and --subsampling are very powerful together.&#x27;, &#x27;Want to rank feature transformations, but not sure which ones to choose? --transformers=default should serve as a solid baseline (common DS transformations included).&#x27;, &#x27;Your target can be any feature! (explaining one feature with others)&#x27;, &#x27;OutRank uses HyperLogLog for cardinality estimation - this is also a potential usecase (understanding cardinalities across different data sets).&#x27;, &#x27;Each feature is named as featureName(cardinality, coverage in percents) in the final files.&#x27;, &#x27;You can generate candidate feature transformation ranges (fw) by using --task=feature_summary_transformers.&#x27;]"}, {"fullname": "outrank.core_utils.write_json_dump_to_file", "modulename": "outrank.core_utils", "qualname": "write_json_dump_to_file", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>, </span><span class=\"param\"><span class=\"n\">config_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.internal_hash", "modulename": "outrank.core_utils", "qualname": "internal_hash", "kind": "function", "doc": "<p>A generic internal hash used throughout ranking procedure - let's hardcode seed here for sure</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_obj</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.DatasetInformationStorage", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage", "kind": "class", "doc": "<p>A generic class for holding properties of a given type of dataset</p>\n"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.__init__", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">data_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">column_names</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">column_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">col_delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">|</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">encoding</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">fw_map</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">|</span> <span class=\"kc\">None</span></span>)</span>"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.data_path", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.data_path", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.column_names", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.column_names", "kind": "variable", "doc": "<p></p>\n", "annotation": ": list[str]"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.column_types", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.column_types", "kind": "variable", "doc": "<p></p>\n", "annotation": ": set[str]"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.col_delimiter", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.col_delimiter", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str | None"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.encoding", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.encoding", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.fw_map", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.fw_map", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[str, str] | None"}, {"fullname": "outrank.core_utils.NumericFeatureSummary", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary", "kind": "class", "doc": "<p>A generic class storing numeric feature statistics</p>\n"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.__init__", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">feature_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">minimum</span><span class=\"p\">:</span> <span class=\"nb\">float</span>,</span><span class=\"param\">\t<span class=\"n\">maximum</span><span class=\"p\">:</span> <span class=\"nb\">float</span>,</span><span class=\"param\">\t<span class=\"n\">median</span><span class=\"p\">:</span> <span class=\"nb\">float</span>,</span><span class=\"param\">\t<span class=\"n\">num_unique</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span>)</span>"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.feature_name", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.feature_name", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.minimum", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.minimum", "kind": "variable", "doc": "<p></p>\n", "annotation": ": float"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.maximum", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.maximum", "kind": "variable", "doc": "<p></p>\n", "annotation": ": float"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.median", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.median", "kind": "variable", "doc": "<p></p>\n", "annotation": ": float"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.num_unique", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.num_unique", "kind": "variable", "doc": "<p></p>\n", "annotation": ": int"}, {"fullname": "outrank.core_utils.NominalFeatureSummary", "modulename": "outrank.core_utils", "qualname": "NominalFeatureSummary", "kind": "class", "doc": "<p>A generic class storing numeric feature statistics</p>\n"}, {"fullname": "outrank.core_utils.NominalFeatureSummary.__init__", "modulename": "outrank.core_utils", "qualname": "NominalFeatureSummary.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">feature_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">num_unique</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span>)</span>"}, {"fullname": "outrank.core_utils.NominalFeatureSummary.feature_name", "modulename": "outrank.core_utils", "qualname": "NominalFeatureSummary.feature_name", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str"}, {"fullname": "outrank.core_utils.NominalFeatureSummary.num_unique", "modulename": "outrank.core_utils", "qualname": "NominalFeatureSummary.num_unique", "kind": "variable", "doc": "<p></p>\n", "annotation": ": int"}, {"fullname": "outrank.core_utils.BatchRankingSummary", "modulename": "outrank.core_utils", "qualname": "BatchRankingSummary", "kind": "class", "doc": "<p>A generic class representing batched ranking results</p>\n"}, {"fullname": "outrank.core_utils.BatchRankingSummary.__init__", "modulename": "outrank.core_utils", "qualname": "BatchRankingSummary.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplet_scores</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">step_times</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span></span>)</span>"}, {"fullname": "outrank.core_utils.BatchRankingSummary.triplet_scores", "modulename": "outrank.core_utils", "qualname": "BatchRankingSummary.triplet_scores", "kind": "variable", "doc": "<p></p>\n", "annotation": ": list[tuple[str, str, float]]"}, {"fullname": "outrank.core_utils.BatchRankingSummary.step_times", "modulename": "outrank.core_utils", "qualname": "BatchRankingSummary.step_times", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[str, typing.Any]"}, {"fullname": "outrank.core_utils.display_random_tip", "modulename": "outrank.core_utils", "qualname": "display_random_tip", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.get_dataset_info", "modulename": "outrank.core_utils", "qualname": "get_dataset_info", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.display_tool_name", "modulename": "outrank.core_utils", "qualname": "display_tool_name", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_line", "modulename": "outrank.core_utils", "qualname": "parse_ob_line", "kind": "function", "doc": "<p>Outbrain line parsing - generic TSVs</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">line_string</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;</span><span class=\"se\">\\t</span><span class=\"s1\">&#39;</span>, </span><span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_line_vw", "modulename": "outrank.core_utils", "qualname": "parse_ob_line_vw", "kind": "function", "doc": "<p>Parse a sparse vw line into a pandas df with pre-defined namespace</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">line_string</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">fw_col_mapping</span><span class=\"o\">=</span><span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">table_header</span><span class=\"o\">=</span><span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">include_namespace_info</span><span class=\"o\">=</span><span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span> <span class=\"o\">|</span> <span class=\"kc\">None</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_csv_line", "modulename": "outrank.core_utils", "qualname": "parse_ob_csv_line", "kind": "function", "doc": "<p>Data can have commas within JSON field dumps</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">line_string</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;,&#39;</span>, </span><span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.generic_line_parser", "modulename": "outrank.core_utils", "qualname": "generic_line_parser", "kind": "function", "doc": "<p>A generic method aimed to parse data from different sources.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">line_string</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">fw_col_mapping</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">table_header</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.read_reference_json", "modulename": "outrank.core_utils", "qualname": "read_reference_json", "kind": "function", "doc": "<p>A helper method for reading a JSON</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">json_path</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">dict</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_namespace", "modulename": "outrank.core_utils", "qualname": "parse_namespace", "kind": "function", "doc": "<p>Parse the feature namespace for type awareness</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">namespace_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.read_column_names", "modulename": "outrank.core_utils", "qualname": "read_column_names", "kind": "function", "doc": "<p>Read the col. header</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">mapping_file</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_vw_feature_information", "modulename": "outrank.core_utils", "qualname": "parse_ob_vw_feature_information", "kind": "function", "doc": "<p>A generic parser of ob-based data</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_raw_feature_information", "modulename": "outrank.core_utils", "qualname": "parse_ob_raw_feature_information", "kind": "function", "doc": "<p>A generic parser of ob-based data</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_feature_information", "modulename": "outrank.core_utils", "qualname": "parse_ob_feature_information", "kind": "function", "doc": "<p>A generic parser of ob-based data</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_csv_with_description_information", "modulename": "outrank.core_utils", "qualname": "parse_csv_with_description_information", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_csv_raw", "modulename": "outrank.core_utils", "qualname": "parse_csv_raw", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.extract_features_from_reference_JSON", "modulename": "outrank.core_utils", "qualname": "extract_features_from_reference_JSON", "kind": "function", "doc": "<p>Given a model's JSON, extract unique features</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">json_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">combined_features_only</span><span class=\"o\">=</span><span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">all_features</span><span class=\"o\">=</span><span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.summarize_feature_bounds_for_transformers", "modulename": "outrank.core_utils", "qualname": "summarize_feature_bounds_for_transformers", "kind": "function", "doc": "<p>summarization auxilliary method for generating JSON-based specs</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">bounds_object_storage</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">feature_types</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">task_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">label_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">granularity</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">15</span>,</span><span class=\"param\">\t<span class=\"n\">output_summary_table_only</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.summarize_rare_counts", "modulename": "outrank.core_utils", "qualname": "summarize_rare_counts", "kind": "function", "doc": "<p>Write rare values</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">term_counter</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">cardinality_object</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">object_info</span><span class=\"p\">:</span> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.is_prior_heuristic", "modulename": "outrank.core_utils", "qualname": "is_prior_heuristic", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">bool</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.get_num_of_instances", "modulename": "outrank.core_utils", "qualname": "get_num_of_instances", "kind": "function", "doc": "<p>Count the number of lines in a file, fast - useful for progress logging</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">fname</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">int</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.feature_transformations", "modulename": "outrank.feature_transformations", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault", "modulename": "outrank.feature_transformations.feature_transformer_vault", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.default_transformers", "modulename": "outrank.feature_transformations.feature_transformer_vault.default_transformers", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS", "modulename": "outrank.feature_transformations.feature_transformer_vault.default_transformers", "qualname": "MINIMAL_TRANSFORMERS", "kind": "variable", "doc": "<p></p>\n", "default_value": "{&#x27;_tr_sqrt&#x27;: &#x27;np.sqrt(X)&#x27;, &#x27;_tr_log(x+1)&#x27;: &#x27;np.log(X + 1)&#x27;, &#x27;_tr_sqrt(abs(x))&#x27;: &#x27;np.sqrt(np.abs(X))&#x27;, &#x27;_tr_log(abs(x)+1)&#x27;: &#x27;np.log(np.abs(X) + 1)&#x27;}"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS", "modulename": "outrank.feature_transformations.feature_transformer_vault.default_transformers", "qualname": "DEFAULT_TRANSFORMERS", "kind": "variable", "doc": "<p></p>\n", "default_value": "{&#x27;_tr_sqrt&#x27;: &#x27;np.sqrt(X)&#x27;, &#x27;_tr_log(x+1)&#x27;: &#x27;np.log(X + 1)&#x27;, &#x27;_tr_sqrt(abs(x))&#x27;: &#x27;np.sqrt(np.abs(X))&#x27;, &#x27;_tr_log(abs(x)+1)&#x27;: &#x27;np.log(np.abs(X) + 1)&#x27;, &#x27;_tr_div(x,abs(x))*log(abs(x))&#x27;: &#x27;np.divide(X, np.abs(X)) * np.log(np.abs(X))&#x27;, &#x27;_tr_log(x + sqrt(pow(x,2), 1)&#x27;: &#x27;np.log(X + np.sqrt(np.power(X, 2) + 1))&#x27;, &#x27;_tr_log*sqrt&#x27;: &#x27;np.log(X + 1) * np.sqrt(X)&#x27;, &#x27;_tr_log*100&#x27;: &#x27;np.round(np.log(X + 1) * 100, 0)&#x27;, &#x27;_tr_nonzero&#x27;: &#x27;np.where(X != 0, 1, 0)&#x27;, &#x27;_tr_round(div(x,max))&#x27;: &#x27;np.round(np.divide(X, np.max(X)), 0)&#x27;}"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "modulename": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS", "modulename": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "qualname": "FW_TRANSFORMERS", "kind": "variable", "doc": "<p></p>\n", "default_value": "{&#x27;_tr_sqrt&#x27;: &#x27;np.sqrt(X)&#x27;, &#x27;_tr_log(x+1)&#x27;: &#x27;np.log(X + 1)&#x27;, &#x27;_tr_sqrt(abs(x))&#x27;: &#x27;np.sqrt(np.abs(X))&#x27;, &#x27;_tr_log(abs(x)+1)&#x27;: &#x27;np.log(np.abs(X) + 1)&#x27;, &#x27;_tr_div(x,abs(x))*log(abs(x))&#x27;: &#x27;np.divide(X, np.abs(X)) * np.log(np.abs(X))&#x27;, &#x27;_tr_log(x + sqrt(pow(x,2), 1)&#x27;: &#x27;np.log(X + np.sqrt(np.power(X, 2) + 1))&#x27;, &#x27;_tr_log*sqrt&#x27;: &#x27;np.log(X + 1) * np.sqrt(X)&#x27;, &#x27;_tr_log*100&#x27;: &#x27;np.round(np.log(X + 1) * 100, 0)&#x27;, &#x27;_tr_nonzero&#x27;: &#x27;np.where(X != 0, 1, 0)&#x27;, &#x27;_tr_round(div(x,max))&#x27;: &#x27;np.round(np.divide(X, np.max(X)), 0)&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_1&#x27;: &#x27;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_1&#x27;: &#x27;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_2&#x27;: &#x27;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_2&#x27;: &#x27;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_4&#x27;: &#x27;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_4&#x27;: &#x27;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_8&#x27;: &#x27;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_8&#x27;: &#x27;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_16&#x27;: &#x27;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_16&#x27;: &#x27;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_32&#x27;: &#x27;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_32&#x27;: &#x27;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_64&#x27;: &#x27;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_64&#x27;: &#x27;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_96&#x27;: &#x27;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_96&#x27;: &#x27;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_1&#x27;: &#x27;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_1&#x27;: &#x27;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_2&#x27;: &#x27;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_2&#x27;: &#x27;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_4&#x27;: &#x27;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_4&#x27;: &#x27;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_8&#x27;: &#x27;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_8&#x27;: &#x27;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_16&#x27;: &#x27;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_16&#x27;: &#x27;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_32&#x27;: &#x27;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_32&#x27;: &#x27;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_64&#x27;: &#x27;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_64&#x27;: &#x27;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_96&#x27;: &#x27;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_96&#x27;: &#x27;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_1&#x27;: &#x27;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_1&#x27;: &#x27;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_2&#x27;: &#x27;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_2&#x27;: &#x27;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_4&#x27;: &#x27;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_4&#x27;: &#x27;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_8&#x27;: &#x27;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_8&#x27;: &#x27;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_16&#x27;: &#x27;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_16&#x27;: &#x27;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_32&#x27;: &#x27;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_32&#x27;: &#x27;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_64&#x27;: &#x27;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_64&#x27;: &#x27;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_96&#x27;: &#x27;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_96&#x27;: &#x27;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_1&#x27;: &#x27;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_1&#x27;: &#x27;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_2&#x27;: &#x27;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_2&#x27;: &#x27;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_4&#x27;: &#x27;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_4&#x27;: &#x27;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_8&#x27;: &#x27;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_8&#x27;: &#x27;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_16&#x27;: &#x27;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_16&#x27;: &#x27;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_32&#x27;: &#x27;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_32&#x27;: &#x27;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_64&#x27;: &#x27;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_64&#x27;: &#x27;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_96&#x27;: &#x27;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_96&#x27;: &#x27;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.01&#x27;: &#x27;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.01&#x27;: &#x27;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.02&#x27;: &#x27;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.02&#x27;: &#x27;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.04&#x27;: &#x27;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.04&#x27;: &#x27;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.08&#x27;: &#x27;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.08&#x27;: &#x27;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.16&#x27;: &#x27;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.16&#x27;: &#x27;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.32&#x27;: &#x27;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.32&#x27;: &#x27;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.64&#x27;: &#x27;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.64&#x27;: &#x27;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.96&#x27;: &#x27;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.96&#x27;: &#x27;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.01&#x27;: &#x27;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.01&#x27;: &#x27;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.02&#x27;: &#x27;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.02&#x27;: &#x27;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.04&#x27;: &#x27;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.04&#x27;: &#x27;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.08&#x27;: &#x27;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.08&#x27;: &#x27;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.16&#x27;: &#x27;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.16&#x27;: &#x27;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.32&#x27;: &#x27;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.32&#x27;: &#x27;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.64&#x27;: &#x27;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.64&#x27;: &#x27;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.96&#x27;: &#x27;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.96&#x27;: &#x27;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.01&#x27;: &#x27;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.01&#x27;: &#x27;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.02&#x27;: &#x27;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.02&#x27;: &#x27;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.04&#x27;: &#x27;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.04&#x27;: &#x27;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.08&#x27;: &#x27;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.08&#x27;: &#x27;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.16&#x27;: &#x27;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.16&#x27;: &#x27;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.32&#x27;: &#x27;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.32&#x27;: &#x27;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.64&#x27;: &#x27;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.64&#x27;: &#x27;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.96&#x27;: &#x27;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.96&#x27;: &#x27;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.01&#x27;: &#x27;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.01&#x27;: &#x27;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.02&#x27;: &#x27;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.02&#x27;: &#x27;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.04&#x27;: &#x27;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.04&#x27;: &#x27;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.08&#x27;: &#x27;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.08&#x27;: &#x27;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.16&#x27;: &#x27;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.16&#x27;: &#x27;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.32&#x27;: &#x27;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.32&#x27;: &#x27;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.64&#x27;: &#x27;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.64&#x27;: &#x27;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.96&#x27;: &#x27;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.96&#x27;: &#x27;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*100,0), 0))&#x27;}"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range", "modulename": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "qualname": "resolution_range", "kind": "variable", "doc": "<p></p>\n", "default_value": "[1, 10, 50, 100]"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range", "modulename": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "qualname": "greater_than_range", "kind": "variable", "doc": "<p></p>\n", "default_value": "[1, 2, 4, 8, 16, 32, 64, 96]"}, {"fullname": "outrank.feature_transformations.ranking_transformers", "modulename": "outrank.feature_transformations.ranking_transformers", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerNoise", "kind": "class", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerNoise.noise_preset", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerNoise.construct_new_features", "kind": "function", "doc": "<p>Generate a few standard noise distributions</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>, </span><span class=\"param\"><span class=\"n\">label_column</span><span class=\"o\">=</span><span class=\"kc\">None</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric", "kind": "class", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">numeric_column_names</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>, </span><span class=\"param\"><span class=\"n\">preset</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;default&#39;</span></span>)</span>"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.numeric_column_names", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.constructed_feature_names", "kind": "variable", "doc": "<p></p>\n", "annotation": ": set[str]"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.max_maj_support", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.nan_prop_support", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.get_vals", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">tmp_df</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>, </span><span class=\"param\"><span class=\"n\">col_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.construct_baseline_features", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">dataframe</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.construct_new_features", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">dataframe</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_generators", "modulename": "outrank.task_generators", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_generators.logger", "modulename": "outrank.task_generators", "qualname": "logger", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;Logger syn-logger (DEBUG)&gt;"}, {"fullname": "outrank.task_generators.outrank_task_generate_data_set", "modulename": "outrank.task_generators", "qualname": "outrank_task_generate_data_set", "kind": "function", "doc": "<p>Core method for generating data sets</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_instance_ranking", "modulename": "outrank.task_instance_ranking", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_instance_ranking.shannon_ent", "modulename": "outrank.task_instance_ranking", "qualname": "shannon_ent", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">string</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">float</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_instance_ranking.compute_entropy_avg", "modulename": "outrank.task_instance_ranking", "qualname": "compute_entropy_avg", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">line</span><span class=\"p\">:</span> <span class=\"nb\">list</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">float</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_instance_ranking.score_line", "modulename": "outrank.task_instance_ranking", "qualname": "score_line", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">line</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_instance_ranking.outrank_task_rank_instances", "modulename": "outrank.task_instance_ranking", "qualname": "outrank_task_rank_instances", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_ranking", "modulename": "outrank.task_ranking", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_ranking.outrank_task_conduct_ranking", "modulename": "outrank.task_ranking", "qualname": "outrank_task_conduct_ranking", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_selftest", "modulename": "outrank.task_selftest", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_selftest.logger", "modulename": "outrank.task_selftest", "qualname": "logger", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;Logger syn-logger (DEBUG)&gt;"}, {"fullname": "outrank.task_selftest.conduct_self_test", "modulename": "outrank.task_selftest", "qualname": "conduct_self_test", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_summary", "modulename": "outrank.task_summary", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_summary.outrank_task_result_summary", "modulename": "outrank.task_summary", "qualname": "outrank_task_result_summary", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_visualization", "modulename": "outrank.task_visualization", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_visualization.outrank_task_visualize_results", "modulename": "outrank.task_visualization", "qualname": "outrank_task_visualize_results", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.visualizations", "modulename": "outrank.visualizations", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.visualizations.ranking_visualization", "modulename": "outrank.visualizations.ranking_visualization", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters", "modulename": "outrank.visualizations.ranking_visualization", "qualname": "visualize_hierarchical_clusters", "kind": "function", "doc": "<p>A method for visualization of hierarchical clusters w.r.t. different linkage functions</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplet_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">output_folder</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">image_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;png&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">max_num_clusters</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">100</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.visualizations.ranking_visualization.visualize_heatmap", "modulename": "outrank.visualizations.ranking_visualization", "qualname": "visualize_heatmap", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplets</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">output_folder</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">image_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.visualizations.ranking_visualization.visualize_barplots", "modulename": "outrank.visualizations.ranking_visualization", "qualname": "visualize_barplots", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplets</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">output_folder</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">reference_json</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">image_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">label</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">heuristic</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.visualizations.ranking_visualization.visualize_all", "modulename": "outrank.visualizations.ranking_visualization", "qualname": "visualize_all", "kind": "function", "doc": "<p>A method for visualization of the obtained feature interaction maps.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplets</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">output_folder</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">label</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">reference_json</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">image_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;png&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">heuristic</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;MI&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}];
+    /** pdoc search index */const docs = [{"fullname": "outrank", "modulename": "outrank", "kind": "module", "doc": "<h1 id=\"welcome-to-outranks-documentation\">Welcome to OutRank's documentation!</h1>\n\n<p>All functions/methods can be searched-for (search bar on the left).</p>\n\n<p>This tool enables fast screening of feature-feature interactions. Its purpose is to give the user fast insight into potential redundancies/anomalies in the data.\nIt is implemented to operate in _mini batches_, it traverses the <code>raw data</code> incrementally, refining the rankings as it goes along. The core operation, interaction ranking, outputs triplets which look as follows:</p>\n\n<pre><code>featureA    featureB    0.512\nfeatureA    featureC    0.125\n</code></pre>\n\n<h1 id=\"setup\">Setup</h1>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code>pip<span class=\"w\"> </span>install<span class=\"w\"> </span>outrank\n</code></pre>\n</div>\n\n<p>and test a minimal cycle with</p>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code>outrank<span class=\"w\"> </span>--task<span class=\"w\"> </span>selftest\n</code></pre>\n</div>\n\n<p>if this passes, you can be pretty certain OutRank will perform as intended. OutRank's primary use case is as a CLI tool, begin exploring with</p>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code>outrank<span class=\"w\"> </span>--help\n</code></pre>\n</div>\n\n<h1 id=\"example-use-cases\">Example use cases</h1>\n\n<ul>\n<li><p>A minimal showcase of performing feature ranking on a generic CSV is demonstrated with <a href=\"https://github.com/outbrain/outrank/tree/main/scripts/run_minimal.sh\">this example</a>.</p></li>\n<li><p><a href=\"https://github.com/outbrain/outrank/tree/main/examples\">More examples</a> demonstrating OutRank's capabilities are also available.</p></li>\n</ul>\n\n<h1 id=\"outrank-as-a-python-library\">OutRank as a Python library</h1>\n\n<p>Once installed, _OutRank_ can be used as any other Python library. For example, generic feature ranking algorithms can be accessed as</p>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"kn\">from</span> <span class=\"nn\">outrank.algorithms.feature_ranking.ranking_mi_numba</span> <span class=\"kn\">import</span> <span class=\"p\">(</span>\n    <span class=\"n\">mutual_info_estimator_numba</span><span class=\"p\">,</span>\n<span class=\"p\">)</span>\n\n<span class=\"c1\"># Some synthetic minimal data (Numpy vectors)</span>\n<span class=\"n\">a</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">([</span><span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">],</span> <span class=\"n\">dtype</span><span class=\"o\">=</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">int32</span><span class=\"p\">)</span>\n\n<span class=\"n\">lowest</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">(</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">random</span><span class=\"o\">.</span><span class=\"n\">permutation</span><span class=\"p\">(</span><span class=\"n\">a</span><span class=\"p\">),</span> <span class=\"n\">dtype</span><span class=\"o\">=</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">int32</span><span class=\"p\">)</span>\n<span class=\"n\">medium</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">([</span><span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">],</span> <span class=\"n\">dtype</span><span class=\"o\">=</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">int32</span><span class=\"p\">)</span>\n<span class=\"n\">high</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">([</span><span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">],</span> <span class=\"n\">dtype</span><span class=\"o\">=</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">int32</span><span class=\"p\">)</span>\n\n<span class=\"n\">lowest_score</span> <span class=\"o\">=</span> <span class=\"n\">mutual_info_estimator_numba</span><span class=\"p\">(</span>\n    <span class=\"n\">a</span><span class=\"p\">,</span> <span class=\"n\">lowest</span><span class=\"p\">,</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">float32</span><span class=\"p\">(</span><span class=\"mf\">1.0</span><span class=\"p\">),</span> <span class=\"kc\">False</span><span class=\"p\">,</span>\n<span class=\"p\">)</span>\n<span class=\"n\">medium_score</span> <span class=\"o\">=</span> <span class=\"n\">mutual_info_estimator_numba</span><span class=\"p\">(</span>\n    <span class=\"n\">a</span><span class=\"p\">,</span> <span class=\"n\">medium</span><span class=\"p\">,</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">float32</span><span class=\"p\">(</span><span class=\"mf\">1.0</span><span class=\"p\">),</span> <span class=\"kc\">False</span><span class=\"p\">,</span>\n<span class=\"p\">)</span>\n<span class=\"n\">high_score</span> <span class=\"o\">=</span> <span class=\"n\">mutual_info_estimator_numba</span><span class=\"p\">(</span>\n    <span class=\"n\">a</span><span class=\"p\">,</span> <span class=\"n\">high</span><span class=\"p\">,</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">float32</span><span class=\"p\">(</span><span class=\"mf\">1.0</span><span class=\"p\">),</span> <span class=\"kc\">False</span><span class=\"p\">,</span>\n<span class=\"p\">)</span>\n\n<span class=\"n\">scores</span> <span class=\"o\">=</span> <span class=\"p\">[</span><span class=\"n\">lowest_score</span><span class=\"p\">,</span> <span class=\"n\">medium_score</span><span class=\"p\">,</span> <span class=\"n\">high_score</span><span class=\"p\">]</span>\n<span class=\"n\">sorted_score_indices</span> <span class=\"o\">=</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">argsort</span><span class=\"p\">(</span><span class=\"n\">scores</span><span class=\"p\">)</span>\n<span class=\"k\">assert</span> <span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">sum</span><span class=\"p\">(</span><span class=\"n\">np</span><span class=\"o\">.</span><span class=\"n\">array</span><span class=\"p\">([</span><span class=\"mi\">0</span><span class=\"p\">,</span> <span class=\"mi\">1</span><span class=\"p\">,</span> <span class=\"mi\">2</span><span class=\"p\">])</span> <span class=\"o\">-</span> <span class=\"n\">sorted_score_indices</span><span class=\"p\">)</span> <span class=\"o\">==</span>  <span class=\"mi\">0</span>\n</code></pre>\n</div>\n\n<hr />\n\n<h2 id=\"creating-a-simple-dataset\">Creating a simple dataset</h2>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"kn\">from</span> <span class=\"nn\">outrank.algorithms.synthetic_data_generators.cc_generator</span> <span class=\"kn\">import</span> <span class=\"n\">CategoricalClassification</span>\n\n<span class=\"n\">cc</span> <span class=\"o\">=</span> <span class=\"n\">CategoricalClassification</span><span class=\"p\">()</span>\n\n<span class=\"c1\"># Creates a simple dataset of 10 features, 10k samples, with feature cardinality of all features being 35</span>\n<span class=\"n\">X</span> <span class=\"o\">=</span> <span class=\"n\">cc</span><span class=\"o\">.</span><span class=\"n\">generate_data</span><span class=\"p\">(</span><span class=\"mi\">9</span><span class=\"p\">,</span> \n                     <span class=\"mi\">10000</span><span class=\"p\">,</span> \n                     <span class=\"n\">cardinality</span><span class=\"o\">=</span><span class=\"mi\">35</span><span class=\"p\">,</span> \n                     <span class=\"n\">ensure_rep</span><span class=\"o\">=</span><span class=\"kc\">True</span><span class=\"p\">,</span> \n                     <span class=\"n\">random_values</span><span class=\"o\">=</span><span class=\"kc\">True</span><span class=\"p\">,</span> \n                     <span class=\"n\">low</span><span class=\"o\">=</span><span class=\"mi\">0</span><span class=\"p\">,</span> \n                     <span class=\"n\">high</span><span class=\"o\">=</span><span class=\"mi\">40</span><span class=\"p\">)</span>\n\n<span class=\"c1\"># Creates target labels via clustering</span>\n<span class=\"n\">y</span> <span class=\"o\">=</span> <span class=\"n\">cc</span><span class=\"o\">.</span><span class=\"n\">generate_labels</span><span class=\"p\">(</span><span class=\"n\">X</span><span class=\"p\">,</span> <span class=\"n\">n</span><span class=\"o\">=</span><span class=\"mi\">2</span><span class=\"p\">,</span> <span class=\"n\">class_relation</span><span class=\"o\">=</span><span class=\"s1\">&#39;cluster&#39;</span><span class=\"p\">)</span>\n</code></pre>\n</div>\n"}, {"fullname": "outrank.algorithms", "modulename": "outrank.algorithms", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.feature_ranking", "modulename": "outrank.algorithms.feature_ranking", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.numba_unique", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "numba_unique", "kind": "function", "doc": "<p>Identify unique elements in an array, fast</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">a</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_conditional_entropy", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "compute_conditional_entropy", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">Y_classes</span>,</span><span class=\"param\">\t<span class=\"n\">class_values</span>,</span><span class=\"param\">\t<span class=\"n\">class_var_shape</span>,</span><span class=\"param\">\t<span class=\"n\">initial_prob</span>,</span><span class=\"param\">\t<span class=\"n\">nonzero_counts</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.compute_entropies", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "compute_entropies", "kind": "function", "doc": "<p>Core entropy computation function</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">X</span>, </span><span class=\"param\"><span class=\"n\">Y</span>, </span><span class=\"param\"><span class=\"n\">all_events</span>, </span><span class=\"param\"><span class=\"n\">f_values</span>, </span><span class=\"param\"><span class=\"n\">f_value_counts</span>, </span><span class=\"param\"><span class=\"n\">cardinality_correction</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.stratified_subsampling", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "stratified_subsampling", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">Y</span>, </span><span class=\"param\"><span class=\"n\">X</span>, </span><span class=\"param\"><span class=\"n\">approximation_factor</span>, </span><span class=\"param\"><span class=\"n\">_f_values_X</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.feature_ranking.ranking_mi_numba.mutual_info_estimator_numba", "modulename": "outrank.algorithms.feature_ranking.ranking_mi_numba", "qualname": "mutual_info_estimator_numba", "kind": "function", "doc": "<p>Core estimator logic. Compute unique elements, subset if required</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">Y</span>, </span><span class=\"param\"><span class=\"n\">X</span>, </span><span class=\"param\"><span class=\"n\">approximation_factor</span><span class=\"o\">=</span><span class=\"mf\">1.0</span>, </span><span class=\"param\"><span class=\"n\">cardinality_correction</span><span class=\"o\">=</span><span class=\"kc\">False</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator", "modulename": "outrank.algorithms.importance_estimator", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.importance_estimator.logger", "modulename": "outrank.algorithms.importance_estimator", "qualname": "logger", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;Logger syn-logger (DEBUG)&gt;"}, {"fullname": "outrank.algorithms.importance_estimator.num_folds", "modulename": "outrank.algorithms.importance_estimator", "qualname": "num_folds", "kind": "variable", "doc": "<p></p>\n", "default_value": "4"}, {"fullname": "outrank.algorithms.importance_estimator.sklearn_MI", "modulename": "outrank.algorithms.importance_estimator", "qualname": "sklearn_MI", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">vector_first</span><span class=\"p\">:</span> <span class=\"n\">Any</span>, </span><span class=\"param\"><span class=\"n\">vector_second</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">float</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.sklearn_surrogate", "modulename": "outrank.algorithms.importance_estimator", "qualname": "sklearn_surrogate", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">vector_first</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">vector_second</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">surrogate_model</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">float</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.numba_mi", "modulename": "outrank.algorithms.importance_estimator", "qualname": "numba_mi", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">vector_first</span>, </span><span class=\"param\"><span class=\"n\">vector_second</span>, </span><span class=\"param\"><span class=\"n\">heuristic</span>, </span><span class=\"param\"><span class=\"n\">mi_stratified_sampling_ratio</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.sklearn_mi_adj", "modulename": "outrank.algorithms.importance_estimator", "qualname": "sklearn_mi_adj", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">vector_first</span>, </span><span class=\"param\"><span class=\"n\">vector_second</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.get_importances_estimate_pairwise", "modulename": "outrank.algorithms.importance_estimator", "qualname": "get_importances_estimate_pairwise", "kind": "function", "doc": "<p>A method for parallel importances estimation. As interaction scoring is independent, individual scores can be computed in parallel.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">combination</span>, </span><span class=\"param\"><span class=\"n\">reference_model_features</span>, </span><span class=\"param\"><span class=\"n\">args</span>, </span><span class=\"param\"><span class=\"n\">tmp_df</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.rank_features_3MR", "modulename": "outrank.algorithms.importance_estimator", "qualname": "rank_features_3MR", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">relevance_dict</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">redundancy_dict</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">relational_dict</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">strategy</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;median&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">alpha</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mi\">1</span>,</span><span class=\"param\">\t<span class=\"n\">beta</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mi\">1</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.get_importances_estimate_nonmyopic", "modulename": "outrank.algorithms.importance_estimator", "qualname": "get_importances_estimate_nonmyopic", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>, </span><span class=\"param\"><span class=\"n\">tmp_df</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.importance_estimator.initialize_classifier", "modulename": "outrank.algorithms.importance_estimator", "qualname": "initialize_classifier", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">surrogate_model</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches", "modulename": "outrank.algorithms.sketches", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms", "modulename": "outrank.algorithms.sketches.counting_cms", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.cms_hash", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "cms_hash", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">x</span>, </span><span class=\"param\"><span class=\"n\">seed</span>, </span><span class=\"param\"><span class=\"n\">width</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch", "kind": "class", "doc": "<p>A memory-efficient implementation of the count min sketch algorithm with optimized hashing using Numba JIT.</p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.__init__", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">depth</span><span class=\"o\">=</span><span class=\"mi\">6</span>, </span><span class=\"param\"><span class=\"n\">width</span><span class=\"o\">=</span><span class=\"mi\">32768</span>, </span><span class=\"param\"><span class=\"n\">M</span><span class=\"o\">=</span><span class=\"kc\">None</span></span>)</span>"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.depth", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.depth", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.width", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.width", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.hash_seeds", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.hash_seeds", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.M", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.M", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.add", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">x</span>, </span><span class=\"param\"><span class=\"n\">delta</span><span class=\"o\">=</span><span class=\"mi\">1</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.batch_add", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.batch_add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">lst</span>, </span><span class=\"param\"><span class=\"n\">delta</span><span class=\"o\">=</span><span class=\"mi\">1</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.query", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.query", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">x</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_cms.CountMinSketch.get_matrix", "modulename": "outrank.algorithms.sketches.counting_cms", "qualname": "CountMinSketch.get_matrix", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter", "kind": "class", "doc": "<p>A memory-efficient implementation of the count min sketch algorithm with optimized hashing using Numba JIT.</p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.__init__", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">bound</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">30000</span></span>)</span>"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.max_bound_thr", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.max_bound_thr", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.default_counter", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.default_counter", "kind": "variable", "doc": "<p></p>\n", "annotation": ": collections.Counter"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.batch_add", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.batch_add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">lst</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_counters_ordinary.PrimitiveConstrainedCounter.add", "modulename": "outrank.algorithms.sketches.counting_counters_ordinary", "qualname": "PrimitiveConstrainedCounter.add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">val</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "kind": "module", "doc": "<p>This module implements probabilistic data structure which is able to calculate the cardinality of large multisets in a single pass using little auxiliary memory</p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache", "kind": "class", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.__init__", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">error_rate</span><span class=\"o\">=</span><span class=\"mf\">0.005</span></span>)</span>"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.p", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.p", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.m", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.m", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_set", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.warmup_set", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.warmup_size", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.warmup_size", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.width", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.width", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.hll_flag", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.hll_flag", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.sketches.counting_ultiloglog.HyperLogLogWCache.add", "modulename": "outrank.algorithms.sketches.counting_ultiloglog", "qualname": "HyperLogLogWCache.add", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">value</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators", "modulename": "outrank.algorithms.synthetic_data_generators", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification", "kind": "class", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.__init__", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">seed</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">42</span></span>)</span>"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.dataset_info", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.dataset_info", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_data", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_data", "kind": "function", "doc": "<p>Generates dataset based on given parameters</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>n_features</strong>:  number of generated features</li>\n<li><strong>n_samples</strong>:  number of generated samples</li>\n<li><strong>cardinality</strong>:  default cardinality of the dataset</li>\n<li><strong>structure</strong>:  structure of the dataset</li>\n<li><strong>ensure_rep</strong>:  flag, ensures all given values represented</li>\n<li><strong>random_values</strong>:  flag, enables random (integer) feature values from set [low, high]</li>\n<li><strong>low</strong>:  sets lower bound of random feature values</li>\n<li><strong>high</strong>:  sets high bound of random feature values</li>\n<li><strong>seed</strong>:  sets seed of numpy random</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>X, 2D dataset</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">n_features</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">n_samples</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">cardinality</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">5</span>,</span><span class=\"param\">\t<span class=\"n\">structure</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]],</span> <span class=\"n\">NoneType</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">ensure_rep</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">random_values</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">low</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"mi\">0</span>,</span><span class=\"param\">\t<span class=\"n\">high</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"mi\">1000</span>,</span><span class=\"param\">\t<span class=\"n\">seed</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">42</span></span><span class=\"return-annotation\">) -> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_combinations", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_combinations", "kind": "function", "doc": "<p>Generates linear, nonlinear, or custom combinations within feature vectors in given dataset X</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset</li>\n<li><strong>feature_indices</strong>:  indexes of features to be in combination</li>\n<li><strong>combination_function</strong>:  optional custom function for combining feature vectors</li>\n<li><strong>combination_type</strong>:  string flag, either liner or nonlinear, defining combination type</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>X with added resultant feature</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">feature_indices</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">combination_function</span><span class=\"p\">:</span> <span class=\"n\">Optional</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">combination_type</span><span class=\"p\">:</span> <span class=\"n\">Literal</span><span class=\"p\">[</span><span class=\"s1\">&#39;linear&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;nonlinear&#39;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;linear&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_correlated", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_correlated", "kind": "function", "doc": "<p>Generates correlated features using the given feature indices. Correlation is based on cosine of angle between vectors with mean 0.</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset</li>\n<li><strong>feature_indices</strong>:  indices of features to generate correlated feature to</li>\n<li><strong>r</strong>:  (Pearson) correlation factor</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>X with generated correlated  features</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">feature_indices</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">r</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">0.8</span></span><span class=\"return-annotation\">) -> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_duplicates", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_duplicates", "kind": "function", "doc": "<p>Generates duplicate features</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset</li>\n<li><strong>feature_indices</strong>:  indices of features to duplicate</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>dataset with duplicated features</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">feature_indices</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_labels", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_labels", "kind": "function", "doc": "<p>Generates labels for dataset X</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset</li>\n<li><strong>n</strong>:  number of class labels</li>\n<li><strong>p</strong>:  class distribution</li>\n<li><strong>k</strong>:  constant</li>\n<li><strong>decision_function</strong>:  optional user-defined decision function</li>\n<li><strong>class_relation</strong>:  string, either 'linear', 'nonlinear', or 'cluster'</li>\n<li><strong>balance</strong>:  boolean, whether to balance clustering class labels</li>\n<li><strong>random_state</strong>:  seed for KMeans clustering, defaults to 42</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>array of labels, corresponding to dataset X</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">n</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">2</span>,</span><span class=\"param\">\t<span class=\"n\">p</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">float</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span> <span class=\"o\">=</span> <span class=\"mf\">0.5</span>,</span><span class=\"param\">\t<span class=\"n\">k</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">|</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mi\">2</span>,</span><span class=\"param\">\t<span class=\"n\">decision_function</span><span class=\"p\">:</span> <span class=\"n\">Optional</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">class_relation</span><span class=\"p\">:</span> <span class=\"n\">Literal</span><span class=\"p\">[</span><span class=\"s1\">&#39;linear&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;nonlinear&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;cluster&#39;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;linear&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">balance</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">random_state</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">42</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.generate_noise", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.generate_noise", "kind": "function", "doc": "<p>Simulates noise on given dataset X</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset to apply noise to</li>\n<li><strong>y</strong>:  required target labels for categorical noise generation</li>\n<li><strong>p</strong>:  amount of noise to apply. Defaults to 0.2</li>\n<li><strong>type</strong>:  type of noise to apply, either categorical or missing</li>\n<li><strong>missing_val</strong>:  value to simulate missing values. Defaults to float('-inf')</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>X with noise applied</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">y</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">p</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">0.2</span>,</span><span class=\"param\">\t<span class=\"nb\">type</span><span class=\"p\">:</span> <span class=\"n\">Literal</span><span class=\"p\">[</span><span class=\"s1\">&#39;categorical&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;missing&#39;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;categorical&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">missing_val</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">|</span> <span class=\"nb\">int</span> <span class=\"o\">|</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"o\">-</span><span class=\"n\">inf</span></span><span class=\"return-annotation\">) -> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.downsample_dataset", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.downsample_dataset", "kind": "function", "doc": "<p>Downsamples dataset X according to N or the number of samples in minority class, resulting in a balanced dataset.</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  Dataset to downsample</li>\n<li><strong>y</strong>:  Labels corresponding to X</li>\n<li><strong>N</strong>:  Optional number of samples per class to downsample to</li>\n<li><strong>seed</strong>:  Seed for random state of resample function</li>\n<li><strong>reshuffle</strong>:  Reshuffle the dataset after downsampling</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>Balanced X and y after downsampling</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">y</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">N</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">seed</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">42</span>,</span><span class=\"param\">\t<span class=\"n\">reshuffle</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">ndarray</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.cc_generator.CategoricalClassification.print_dataset", "modulename": "outrank.algorithms.synthetic_data_generators.cc_generator", "qualname": "CategoricalClassification.print_dataset", "kind": "function", "doc": "<p>Prints given dataset</p>\n\n<h6 id=\"parameters\">Parameters</h6>\n\n<ul>\n<li><strong>X</strong>:  dataset</li>\n<li><strong>y</strong>:  labels</li>\n</ul>\n\n<h6 id=\"returns\">Returns</h6>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">X</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span>,</span><span class=\"param\">\t<span class=\"n\">y</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_array_like</span><span class=\"o\">.</span><span class=\"n\">_SupportsArray</span><span class=\"p\">[</span><span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">dtype</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]]],</span> <span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">,</span> <span class=\"n\">numpy</span><span class=\"o\">.</span><span class=\"n\">_typing</span><span class=\"o\">.</span><span class=\"n\">_nested_sequence</span><span class=\"o\">.</span><span class=\"n\">_NestedSequence</span><span class=\"p\">[</span><span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">,</span> <span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">complex</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">bytes</span><span class=\"p\">]]]</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.algorithms.synthetic_data_generators.generator_naive", "modulename": "outrank.algorithms.synthetic_data_generators.generator_naive", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.algorithms.synthetic_data_generators.generator_naive.generate_random_matrix", "modulename": "outrank.algorithms.synthetic_data_generators.generator_naive", "qualname": "generate_random_matrix", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">num_features</span><span class=\"o\">=</span><span class=\"mi\">100</span>, </span><span class=\"param\"><span class=\"n\">size</span><span class=\"o\">=</span><span class=\"mi\">20000</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking", "modulename": "outrank.core_ranking", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.core_ranking.logger", "modulename": "outrank.core_ranking", "qualname": "logger", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;Logger syn-logger (DEBUG)&gt;"}, {"fullname": "outrank.core_ranking.GLOBAL_CARDINALITY_STORAGE", "modulename": "outrank.core_ranking", "qualname": "GLOBAL_CARDINALITY_STORAGE", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[typing.Any, typing.Any]", "default_value": "{}"}, {"fullname": "outrank.core_ranking.GLOBAL_COUNTS_STORAGE", "modulename": "outrank.core_ranking", "qualname": "GLOBAL_COUNTS_STORAGE", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[typing.Any, typing.Any]", "default_value": "{}"}, {"fullname": "outrank.core_ranking.GLOBAL_RARE_VALUE_STORAGE", "modulename": "outrank.core_ranking", "qualname": "GLOBAL_RARE_VALUE_STORAGE", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[str, typing.Any]", "default_value": "Counter()"}, {"fullname": "outrank.core_ranking.GLOBAL_PRIOR_COMB_COUNTS", "modulename": "outrank.core_ranking", "qualname": "GLOBAL_PRIOR_COMB_COUNTS", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[typing.Any, int]", "default_value": "Counter()"}, {"fullname": "outrank.core_ranking.IGNORED_VALUES", "modulename": "outrank.core_ranking", "qualname": "IGNORED_VALUES", "kind": "variable", "doc": "<p></p>\n", "default_value": "set()"}, {"fullname": "outrank.core_ranking.HYPERLL_ERROR_BOUND", "modulename": "outrank.core_ranking", "qualname": "HYPERLL_ERROR_BOUND", "kind": "variable", "doc": "<p></p>\n", "default_value": "0.02"}, {"fullname": "outrank.core_ranking.MAX_FEATURES_3MR", "modulename": "outrank.core_ranking", "qualname": "MAX_FEATURES_3MR", "kind": "variable", "doc": "<p></p>\n", "default_value": "10000"}, {"fullname": "outrank.core_ranking.prior_combinations_sample", "modulename": "outrank.core_ranking", "qualname": "prior_combinations_sample", "kind": "function", "doc": "<p>Make sure only relevant subspace of combinations is selected based on prior counts</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">combinations</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.get_combinations_from_columns", "modulename": "outrank.core_ranking", "qualname": "get_combinations_from_columns", "kind": "function", "doc": "<p>Return feature-feature &amp; feature-label combinations, depending on the heuristic and ranking scope</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">all_columns</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">indexes</span><span class=\"o\">.</span><span class=\"n\">base</span><span class=\"o\">.</span><span class=\"n\">Index</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.mixed_rank_graph", "modulename": "outrank.core_ranking", "qualname": "mixed_rank_graph", "kind": "function", "doc": "<p>Compute the full mixed rank graph corresponding to all pairwise feature interactions based on the selected heuristic</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">cpu_pool</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">BatchRankingSummary</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.enrich_with_transformations", "modulename": "outrank.core_ranking", "qualname": "enrich_with_transformations", "kind": "function", "doc": "<p>Construct a collection of new features based on pre-defined transformations/rules</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">num_col_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_combined_features", "modulename": "outrank.core_ranking", "qualname": "compute_combined_features", "kind": "function", "doc": "<p>Compute higher order features via xxhash-based trick.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">is_3mr</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_expanded_multivalue_features", "modulename": "outrank.core_ranking", "qualname": "compute_expanded_multivalue_features", "kind": "function", "doc": "<p>Compute one-hot encoded feature space based on each designated multivalue feature. E.g., feature with value \"a,b,c\" becomes three features, values of which are presence of a given value in a mutlivalue feature of choice.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_subfeatures", "modulename": "outrank.core_ranking", "qualname": "compute_subfeatures", "kind": "function", "doc": "<p>Compute derived features that are more fine-grained. Implements logic around two operators that govern feature construction.\n->: One sided construction - every value from left side is fine, separate ones from the right side feature will be considered.\n&lt;->: Two sided construction - two-sided values present. This means that each value from a is combined with each from b, forming |A|*|B| new features (one-hot encoded)</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.include_noisy_features", "modulename": "outrank.core_ranking", "qualname": "include_noisy_features", "kind": "function", "doc": "<p>Add randomized features that serve as a sanity check</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_coverage", "modulename": "outrank.core_ranking", "qualname": "compute_coverage", "kind": "function", "doc": "<p>Compute coverage of features, incrementally</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_feature_memory_consumption", "modulename": "outrank.core_ranking", "qualname": "compute_feature_memory_consumption", "kind": "function", "doc": "<p>An approximation of how much feature take up</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_value_counts", "modulename": "outrank.core_ranking", "qualname": "compute_value_counts", "kind": "function", "doc": "<p>Update the count structure</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>, </span><span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_cardinalities", "modulename": "outrank.core_ranking", "qualname": "compute_cardinalities", "kind": "function", "doc": "<p>Compute cardinalities of features, incrementally</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">max_unique_hist_constraint</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_bounds_increment", "modulename": "outrank.core_ranking", "qualname": "compute_bounds_increment", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">numeric_column_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.compute_batch_ranking", "modulename": "outrank.core_ranking", "qualname": "compute_batch_ranking", "kind": "function", "doc": "<p>Enrich the feature space and compute the batch importances</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">line_tmp_storage</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">numeric_column_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">cpu_pool</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">column_descriptions</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">pbar</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">BatchRankingSummary</span><span class=\"p\">,</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.get_grouped_df", "modulename": "outrank.core_ranking", "qualname": "get_grouped_df", "kind": "function", "doc": "<p>A helper method that enables median-based aggregation after processing</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">importances_df_list</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.checkpoint_importances_df", "modulename": "outrank.core_ranking", "qualname": "checkpoint_importances_df", "kind": "function", "doc": "<p>A helper which stores intermediary state - useful for longer runs</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">importances_batch</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_ranking.estimate_importances_minibatches", "modulename": "outrank.core_ranking", "qualname": "estimate_importances_minibatches", "kind": "function", "doc": "<p>Interaction score estimator - suitable for example for csv-like input data types.\nThis type of data is normally a single large csv, meaning that minibatch processing needs to\nhappen during incremental handling of the file (that\"s not the case for pre-separated ob data)</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_file</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">column_descriptions</span><span class=\"p\">:</span> <span class=\"nb\">list</span>,</span><span class=\"param\">\t<span class=\"n\">fw_col_mapping</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">numeric_column_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span>,</span><span class=\"param\">\t<span class=\"n\">batch_size</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">100000</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">data_encoding</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;utf-8&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">cpu_pool</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;</span><span class=\"se\">\\t</span><span class=\"s1\">&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">feature_construction_mode</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">logger</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]],</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">defaultdict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_selftest", "modulename": "outrank.core_selftest", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.core_utils", "modulename": "outrank.core_utils", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.core_utils.pro_tips", "modulename": "outrank.core_utils", "qualname": "pro_tips", "kind": "variable", "doc": "<p></p>\n", "default_value": "[&#x27;OutRank can construct subfeatures; features based on subspaces. Example command argument is: --subfeature_mapping &quot;feature_a-&gt;feature_b;feature_c&lt;-&gt;feature_d;feature_c&lt;-&gt;feature_e&quot;&#x27;, &#x27;Heuristic MI-numba-randomized seems like the best of both worlds! (speed + performance).&#x27;, &#x27;Heuristic surrogate-lr performs cross-validation (internally), keep that in mind!&#x27;, &#x27;Consider running OutRank on a smaller data sample first, might be enough (--subsampling = a lot).&#x27;, &#x27;There are two types of combinations supported; unsupervised pairwise ranking (redundancies- --target_ranking_only=False), and supervised combinations - (--interaction_order &gt; 1)&#x27;, &#x27;Visualization part also includes clustering - this might be very insightful!&#x27;, &#x27;By default OutRank includes feature cardinality and coverage in feature names (card; cov)&#x27;, &#x27;Intermediary checkpoints (tmp_checkpoint.tsv) might already give you insights during longer runs.&#x27;, &#x27;In theory, you can rank redundancies of combined features (--interaction_order AND --target_ranking_only=False).&#x27;, &#x27;Give it as many threads as physically possible (--num_threads).&#x27;, &#x27;You can speed up ranking by diminishing feature buffer size (--combination_number_upper_bound determines how many ranking computations per batch will be considered). This, and --subsampling are very powerful together.&#x27;, &#x27;Want to rank feature transformations, but not sure which ones to choose? --transformers=default should serve as a solid baseline (common DS transformations included).&#x27;, &#x27;Your target can be any feature! (explaining one feature with others)&#x27;, &#x27;OutRank uses HyperLogLog for cardinality estimation - this is also a potential usecase (understanding cardinalities across different data sets).&#x27;, &#x27;Each feature is named as featureName(cardinality, coverage in percents) in the final files.&#x27;, &#x27;You can generate candidate feature transformation ranges (fw) by using --task=feature_summary_transformers.&#x27;]"}, {"fullname": "outrank.core_utils.write_json_dump_to_file", "modulename": "outrank.core_utils", "qualname": "write_json_dump_to_file", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>, </span><span class=\"param\"><span class=\"n\">config_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.internal_hash", "modulename": "outrank.core_utils", "qualname": "internal_hash", "kind": "function", "doc": "<p>A generic internal hash used throughout ranking procedure - let's hardcode seed here for sure</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_obj</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.DatasetInformationStorage", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage", "kind": "class", "doc": "<p>A generic class for holding properties of a given type of dataset</p>\n"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.__init__", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">data_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">column_names</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">column_types</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">col_delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">|</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">encoding</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">fw_map</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">|</span> <span class=\"kc\">None</span></span>)</span>"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.data_path", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.data_path", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.column_names", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.column_names", "kind": "variable", "doc": "<p></p>\n", "annotation": ": list[str]"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.column_types", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.column_types", "kind": "variable", "doc": "<p></p>\n", "annotation": ": set[str]"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.col_delimiter", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.col_delimiter", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str | None"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.encoding", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.encoding", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str"}, {"fullname": "outrank.core_utils.DatasetInformationStorage.fw_map", "modulename": "outrank.core_utils", "qualname": "DatasetInformationStorage.fw_map", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[str, str] | None"}, {"fullname": "outrank.core_utils.NumericFeatureSummary", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary", "kind": "class", "doc": "<p>A generic class storing numeric feature statistics</p>\n"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.__init__", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">feature_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">minimum</span><span class=\"p\">:</span> <span class=\"nb\">float</span>,</span><span class=\"param\">\t<span class=\"n\">maximum</span><span class=\"p\">:</span> <span class=\"nb\">float</span>,</span><span class=\"param\">\t<span class=\"n\">median</span><span class=\"p\">:</span> <span class=\"nb\">float</span>,</span><span class=\"param\">\t<span class=\"n\">num_unique</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span>)</span>"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.feature_name", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.feature_name", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.minimum", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.minimum", "kind": "variable", "doc": "<p></p>\n", "annotation": ": float"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.maximum", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.maximum", "kind": "variable", "doc": "<p></p>\n", "annotation": ": float"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.median", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.median", "kind": "variable", "doc": "<p></p>\n", "annotation": ": float"}, {"fullname": "outrank.core_utils.NumericFeatureSummary.num_unique", "modulename": "outrank.core_utils", "qualname": "NumericFeatureSummary.num_unique", "kind": "variable", "doc": "<p></p>\n", "annotation": ": int"}, {"fullname": "outrank.core_utils.NominalFeatureSummary", "modulename": "outrank.core_utils", "qualname": "NominalFeatureSummary", "kind": "class", "doc": "<p>A generic class storing numeric feature statistics</p>\n"}, {"fullname": "outrank.core_utils.NominalFeatureSummary.__init__", "modulename": "outrank.core_utils", "qualname": "NominalFeatureSummary.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">feature_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">num_unique</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span>)</span>"}, {"fullname": "outrank.core_utils.NominalFeatureSummary.feature_name", "modulename": "outrank.core_utils", "qualname": "NominalFeatureSummary.feature_name", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str"}, {"fullname": "outrank.core_utils.NominalFeatureSummary.num_unique", "modulename": "outrank.core_utils", "qualname": "NominalFeatureSummary.num_unique", "kind": "variable", "doc": "<p></p>\n", "annotation": ": int"}, {"fullname": "outrank.core_utils.BatchRankingSummary", "modulename": "outrank.core_utils", "qualname": "BatchRankingSummary", "kind": "class", "doc": "<p>A generic class representing batched ranking results</p>\n"}, {"fullname": "outrank.core_utils.BatchRankingSummary.__init__", "modulename": "outrank.core_utils", "qualname": "BatchRankingSummary.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplet_scores</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">step_times</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span></span>)</span>"}, {"fullname": "outrank.core_utils.BatchRankingSummary.triplet_scores", "modulename": "outrank.core_utils", "qualname": "BatchRankingSummary.triplet_scores", "kind": "variable", "doc": "<p></p>\n", "annotation": ": list[tuple[str, str, float]]"}, {"fullname": "outrank.core_utils.BatchRankingSummary.step_times", "modulename": "outrank.core_utils", "qualname": "BatchRankingSummary.step_times", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[str, typing.Any]"}, {"fullname": "outrank.core_utils.display_random_tip", "modulename": "outrank.core_utils", "qualname": "display_random_tip", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.get_dataset_info", "modulename": "outrank.core_utils", "qualname": "get_dataset_info", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.display_tool_name", "modulename": "outrank.core_utils", "qualname": "display_tool_name", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_line", "modulename": "outrank.core_utils", "qualname": "parse_ob_line", "kind": "function", "doc": "<p>Outbrain line parsing - generic TSVs</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">line_string</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;</span><span class=\"se\">\\t</span><span class=\"s1\">&#39;</span>, </span><span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_line_vw", "modulename": "outrank.core_utils", "qualname": "parse_ob_line_vw", "kind": "function", "doc": "<p>Parse a sparse vw line into a pandas df with pre-defined namespace</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">line_string</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">fw_col_mapping</span><span class=\"o\">=</span><span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">table_header</span><span class=\"o\">=</span><span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">include_namespace_info</span><span class=\"o\">=</span><span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span> <span class=\"o\">|</span> <span class=\"kc\">None</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_csv_line", "modulename": "outrank.core_utils", "qualname": "parse_ob_csv_line", "kind": "function", "doc": "<p>Data can have commas within JSON field dumps</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">line_string</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;,&#39;</span>, </span><span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.generic_line_parser", "modulename": "outrank.core_utils", "qualname": "generic_line_parser", "kind": "function", "doc": "<p>A generic method aimed to parse data from different sources.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">line_string</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">delimiter</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">fw_col_mapping</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">table_header</span><span class=\"p\">:</span> <span class=\"n\">Any</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.read_reference_json", "modulename": "outrank.core_utils", "qualname": "read_reference_json", "kind": "function", "doc": "<p>A helper method for reading a JSON</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">json_path</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">dict</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_namespace", "modulename": "outrank.core_utils", "qualname": "parse_namespace", "kind": "function", "doc": "<p>Parse the feature namespace for type awareness</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">namespace_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.read_column_names", "modulename": "outrank.core_utils", "qualname": "read_column_names", "kind": "function", "doc": "<p>Read the col. header</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">mapping_file</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_vw_feature_information", "modulename": "outrank.core_utils", "qualname": "parse_ob_vw_feature_information", "kind": "function", "doc": "<p>A generic parser of ob-based data</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_raw_feature_information", "modulename": "outrank.core_utils", "qualname": "parse_ob_raw_feature_information", "kind": "function", "doc": "<p>A generic parser of ob-based data</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_ob_feature_information", "modulename": "outrank.core_utils", "qualname": "parse_ob_feature_information", "kind": "function", "doc": "<p>A generic parser of ob-based data</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_csv_with_description_information", "modulename": "outrank.core_utils", "qualname": "parse_csv_with_description_information", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.parse_csv_raw", "modulename": "outrank.core_utils", "qualname": "parse_csv_raw", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">data_path</span></span><span class=\"return-annotation\">) -> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.extract_features_from_reference_JSON", "modulename": "outrank.core_utils", "qualname": "extract_features_from_reference_JSON", "kind": "function", "doc": "<p>Given a model's JSON, extract unique features</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">json_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">combined_features_only</span><span class=\"o\">=</span><span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">all_features</span><span class=\"o\">=</span><span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.summarize_feature_bounds_for_transformers", "modulename": "outrank.core_utils", "qualname": "summarize_feature_bounds_for_transformers", "kind": "function", "doc": "<p>summarization auxilliary method for generating JSON-based specs</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">bounds_object_storage</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">feature_types</span><span class=\"p\">:</span> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">task_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">label_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">granularity</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">15</span>,</span><span class=\"param\">\t<span class=\"n\">output_summary_table_only</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.summarize_rare_counts", "modulename": "outrank.core_utils", "qualname": "summarize_rare_counts", "kind": "function", "doc": "<p>Write rare values</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">term_counter</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">cardinality_object</span><span class=\"p\">:</span> <span class=\"n\">Any</span>,</span><span class=\"param\">\t<span class=\"n\">object_info</span><span class=\"p\">:</span> <span class=\"n\">outrank</span><span class=\"o\">.</span><span class=\"n\">core_utils</span><span class=\"o\">.</span><span class=\"n\">DatasetInformationStorage</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.is_prior_heuristic", "modulename": "outrank.core_utils", "qualname": "is_prior_heuristic", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">bool</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.core_utils.get_num_of_instances", "modulename": "outrank.core_utils", "qualname": "get_num_of_instances", "kind": "function", "doc": "<p>Count the number of lines in a file, fast - useful for progress logging</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">fname</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">int</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.feature_transformations", "modulename": "outrank.feature_transformations", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault", "modulename": "outrank.feature_transformations.feature_transformer_vault", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.default_transformers", "modulename": "outrank.feature_transformations.feature_transformer_vault.default_transformers", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.default_transformers.MINIMAL_TRANSFORMERS", "modulename": "outrank.feature_transformations.feature_transformer_vault.default_transformers", "qualname": "MINIMAL_TRANSFORMERS", "kind": "variable", "doc": "<p></p>\n", "default_value": "{&#x27;_tr_sqrt&#x27;: &#x27;np.sqrt(X)&#x27;, &#x27;_tr_log(x+1)&#x27;: &#x27;np.log(X + 1)&#x27;, &#x27;_tr_sqrt(abs(x))&#x27;: &#x27;np.sqrt(np.abs(X))&#x27;, &#x27;_tr_log(abs(x)+1)&#x27;: &#x27;np.log(np.abs(X) + 1)&#x27;}"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.default_transformers.DEFAULT_TRANSFORMERS", "modulename": "outrank.feature_transformations.feature_transformer_vault.default_transformers", "qualname": "DEFAULT_TRANSFORMERS", "kind": "variable", "doc": "<p></p>\n", "default_value": "{&#x27;_tr_sqrt&#x27;: &#x27;np.sqrt(X)&#x27;, &#x27;_tr_log(x+1)&#x27;: &#x27;np.log(X + 1)&#x27;, &#x27;_tr_sqrt(abs(x))&#x27;: &#x27;np.sqrt(np.abs(X))&#x27;, &#x27;_tr_log(abs(x)+1)&#x27;: &#x27;np.log(np.abs(X) + 1)&#x27;, &#x27;_tr_div(x,abs(x))*log(abs(x))&#x27;: &#x27;np.divide(X, np.abs(X)) * np.log(np.abs(X))&#x27;, &#x27;_tr_log(x + sqrt(pow(x,2), 1)&#x27;: &#x27;np.log(X + np.sqrt(np.power(X, 2) + 1))&#x27;, &#x27;_tr_log*sqrt&#x27;: &#x27;np.log(X + 1) * np.sqrt(X)&#x27;, &#x27;_tr_log*100&#x27;: &#x27;np.round(np.log(X + 1) * 100, 0)&#x27;, &#x27;_tr_nonzero&#x27;: &#x27;np.where(X != 0, 1, 0)&#x27;, &#x27;_tr_round(div(x,max))&#x27;: &#x27;np.round(np.divide(X, np.max(X)), 0)&#x27;}"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "modulename": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.fw_transformers.FW_TRANSFORMERS", "modulename": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "qualname": "FW_TRANSFORMERS", "kind": "variable", "doc": "<p></p>\n", "default_value": "{&#x27;_tr_sqrt&#x27;: &#x27;np.sqrt(X)&#x27;, &#x27;_tr_log(x+1)&#x27;: &#x27;np.log(X + 1)&#x27;, &#x27;_tr_sqrt(abs(x))&#x27;: &#x27;np.sqrt(np.abs(X))&#x27;, &#x27;_tr_log(abs(x)+1)&#x27;: &#x27;np.log(np.abs(X) + 1)&#x27;, &#x27;_tr_div(x,abs(x))*log(abs(x))&#x27;: &#x27;np.divide(X, np.abs(X)) * np.log(np.abs(X))&#x27;, &#x27;_tr_log(x + sqrt(pow(x,2), 1)&#x27;: &#x27;np.log(X + np.sqrt(np.power(X, 2) + 1))&#x27;, &#x27;_tr_log*sqrt&#x27;: &#x27;np.log(X + 1) * np.sqrt(X)&#x27;, &#x27;_tr_log*100&#x27;: &#x27;np.round(np.log(X + 1) * 100, 0)&#x27;, &#x27;_tr_nonzero&#x27;: &#x27;np.where(X != 0, 1, 0)&#x27;, &#x27;_tr_round(div(x,max))&#x27;: &#x27;np.round(np.divide(X, np.max(X)), 0)&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_1&#x27;: &#x27;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_1&#x27;: &#x27;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_2&#x27;: &#x27;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_2&#x27;: &#x27;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_4&#x27;: &#x27;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_4&#x27;: &#x27;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_8&#x27;: &#x27;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_8&#x27;: &#x27;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_16&#x27;: &#x27;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_16&#x27;: &#x27;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_32&#x27;: &#x27;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_32&#x27;: &#x27;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_64&#x27;: &#x27;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_64&#x27;: &#x27;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_1_gt_96&#x27;: &#x27;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*1,0), 0))&#x27;, &#x27;_tr_fw_log_res_1_gt_96&#x27;: &#x27;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*1,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_1&#x27;: &#x27;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_1&#x27;: &#x27;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_2&#x27;: &#x27;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_2&#x27;: &#x27;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_4&#x27;: &#x27;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_4&#x27;: &#x27;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_8&#x27;: &#x27;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_8&#x27;: &#x27;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_16&#x27;: &#x27;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_16&#x27;: &#x27;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_32&#x27;: &#x27;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_32&#x27;: &#x27;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_64&#x27;: &#x27;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_64&#x27;: &#x27;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_10_gt_96&#x27;: &#x27;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*10,0), 0))&#x27;, &#x27;_tr_fw_log_res_10_gt_96&#x27;: &#x27;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*10,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_1&#x27;: &#x27;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_1&#x27;: &#x27;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_2&#x27;: &#x27;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_2&#x27;: &#x27;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_4&#x27;: &#x27;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_4&#x27;: &#x27;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_8&#x27;: &#x27;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_8&#x27;: &#x27;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_16&#x27;: &#x27;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_16&#x27;: &#x27;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_32&#x27;: &#x27;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_32&#x27;: &#x27;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_64&#x27;: &#x27;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_64&#x27;: &#x27;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_50_gt_96&#x27;: &#x27;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*50,0), 0))&#x27;, &#x27;_tr_fw_log_res_50_gt_96&#x27;: &#x27;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*50,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_1&#x27;: &#x27;np.where(X &lt; 1, X, np.where(X&gt;1 ,np.round(np.sqrt(X-1)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_1&#x27;: &#x27;np.where(X &lt;1, X, np.where(X &gt;1, np.round(np.log(X-1)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_2&#x27;: &#x27;np.where(X &lt; 2, X, np.where(X&gt;2 ,np.round(np.sqrt(X-2)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_2&#x27;: &#x27;np.where(X &lt;2, X, np.where(X &gt;2, np.round(np.log(X-2)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_4&#x27;: &#x27;np.where(X &lt; 4, X, np.where(X&gt;4 ,np.round(np.sqrt(X-4)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_4&#x27;: &#x27;np.where(X &lt;4, X, np.where(X &gt;4, np.round(np.log(X-4)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_8&#x27;: &#x27;np.where(X &lt; 8, X, np.where(X&gt;8 ,np.round(np.sqrt(X-8)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_8&#x27;: &#x27;np.where(X &lt;8, X, np.where(X &gt;8, np.round(np.log(X-8)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_16&#x27;: &#x27;np.where(X &lt; 16, X, np.where(X&gt;16 ,np.round(np.sqrt(X-16)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_16&#x27;: &#x27;np.where(X &lt;16, X, np.where(X &gt;16, np.round(np.log(X-16)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_32&#x27;: &#x27;np.where(X &lt; 32, X, np.where(X&gt;32 ,np.round(np.sqrt(X-32)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_32&#x27;: &#x27;np.where(X &lt;32, X, np.where(X &gt;32, np.round(np.log(X-32)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_64&#x27;: &#x27;np.where(X &lt; 64, X, np.where(X&gt;64 ,np.round(np.sqrt(X-64)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_64&#x27;: &#x27;np.where(X &lt;64, X, np.where(X &gt;64, np.round(np.log(X-64)*100,0), 0))&#x27;, &#x27;_tr_fw_sqrt_res_100_gt_96&#x27;: &#x27;np.where(X &lt; 96, X, np.where(X&gt;96 ,np.round(np.sqrt(X-96)*100,0), 0))&#x27;, &#x27;_tr_fw_log_res_100_gt_96&#x27;: &#x27;np.where(X &lt;96, X, np.where(X &gt;96, np.round(np.log(X-96)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.01&#x27;: &#x27;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.01&#x27;: &#x27;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.02&#x27;: &#x27;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.02&#x27;: &#x27;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.04&#x27;: &#x27;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.04&#x27;: &#x27;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.08&#x27;: &#x27;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.08&#x27;: &#x27;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.16&#x27;: &#x27;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.16&#x27;: &#x27;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.32&#x27;: &#x27;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.32&#x27;: &#x27;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.64&#x27;: &#x27;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.64&#x27;: &#x27;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_1_gt_0.96&#x27;: &#x27;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_1_gt_0.96&#x27;: &#x27;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*1,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.01&#x27;: &#x27;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.01&#x27;: &#x27;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.02&#x27;: &#x27;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.02&#x27;: &#x27;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.04&#x27;: &#x27;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.04&#x27;: &#x27;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.08&#x27;: &#x27;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.08&#x27;: &#x27;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.16&#x27;: &#x27;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.16&#x27;: &#x27;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.32&#x27;: &#x27;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.32&#x27;: &#x27;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.64&#x27;: &#x27;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.64&#x27;: &#x27;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_10_gt_0.96&#x27;: &#x27;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_10_gt_0.96&#x27;: &#x27;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*10,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.01&#x27;: &#x27;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.01&#x27;: &#x27;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.02&#x27;: &#x27;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.02&#x27;: &#x27;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.04&#x27;: &#x27;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.04&#x27;: &#x27;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.08&#x27;: &#x27;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.08&#x27;: &#x27;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.16&#x27;: &#x27;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.16&#x27;: &#x27;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.32&#x27;: &#x27;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.32&#x27;: &#x27;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.64&#x27;: &#x27;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.64&#x27;: &#x27;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_50_gt_0.96&#x27;: &#x27;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_50_gt_0.96&#x27;: &#x27;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*50,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.01&#x27;: &#x27;np.where(X &lt; 0.01, X, np.where(X&gt;0.01, np.round(np.sqrt(X-0.01)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.01&#x27;: &#x27;np.where(X &lt;0.01,X, np.where(X&gt;0.01, np.round(np.log(X-0.01)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.02&#x27;: &#x27;np.where(X &lt; 0.02, X, np.where(X&gt;0.02, np.round(np.sqrt(X-0.02)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.02&#x27;: &#x27;np.where(X &lt;0.02,X, np.where(X&gt;0.02, np.round(np.log(X-0.02)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.04&#x27;: &#x27;np.where(X &lt; 0.04, X, np.where(X&gt;0.04, np.round(np.sqrt(X-0.04)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.04&#x27;: &#x27;np.where(X &lt;0.04,X, np.where(X&gt;0.04, np.round(np.log(X-0.04)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.08&#x27;: &#x27;np.where(X &lt; 0.08, X, np.where(X&gt;0.08, np.round(np.sqrt(X-0.08)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.08&#x27;: &#x27;np.where(X &lt;0.08,X, np.where(X&gt;0.08, np.round(np.log(X-0.08)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.16&#x27;: &#x27;np.where(X &lt; 0.16, X, np.where(X&gt;0.16, np.round(np.sqrt(X-0.16)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.16&#x27;: &#x27;np.where(X &lt;0.16,X, np.where(X&gt;0.16, np.round(np.log(X-0.16)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.32&#x27;: &#x27;np.where(X &lt; 0.32, X, np.where(X&gt;0.32, np.round(np.sqrt(X-0.32)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.32&#x27;: &#x27;np.where(X &lt;0.32,X, np.where(X&gt;0.32, np.round(np.log(X-0.32)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.64&#x27;: &#x27;np.where(X &lt; 0.64, X, np.where(X&gt;0.64, np.round(np.sqrt(X-0.64)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.64&#x27;: &#x27;np.where(X &lt;0.64,X, np.where(X&gt;0.64, np.round(np.log(X-0.64)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_sqrt_res_100_gt_0.96&#x27;: &#x27;np.where(X &lt; 0.96, X, np.where(X&gt;0.96, np.round(np.sqrt(X-0.96)*100,0), 0))&#x27;, &#x27;_tr_fw_prob_log_res_100_gt_0.96&#x27;: &#x27;np.where(X &lt;0.96,X, np.where(X&gt;0.96, np.round(np.log(X-0.96)*100,0), 0))&#x27;}"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.fw_transformers.resolution_range", "modulename": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "qualname": "resolution_range", "kind": "variable", "doc": "<p></p>\n", "default_value": "[1, 10, 50, 100]"}, {"fullname": "outrank.feature_transformations.feature_transformer_vault.fw_transformers.greater_than_range", "modulename": "outrank.feature_transformations.feature_transformer_vault.fw_transformers", "qualname": "greater_than_range", "kind": "variable", "doc": "<p></p>\n", "default_value": "[1, 2, 4, 8, 16, 32, 64, 96]"}, {"fullname": "outrank.feature_transformations.ranking_transformers", "modulename": "outrank.feature_transformations.ranking_transformers", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerNoise", "kind": "class", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.noise_preset", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerNoise.noise_preset", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerNoise.construct_new_features", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerNoise.construct_new_features", "kind": "function", "doc": "<p>Generate a few standard noise distributions</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>, </span><span class=\"param\"><span class=\"n\">label_column</span><span class=\"o\">=</span><span class=\"kc\">None</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric", "kind": "class", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.__init__", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">numeric_column_names</span><span class=\"p\">:</span> <span class=\"nb\">set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>, </span><span class=\"param\"><span class=\"n\">preset</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;default&#39;</span></span>)</span>"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.numeric_column_names", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.numeric_column_names", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.constructed_feature_names", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.constructed_feature_names", "kind": "variable", "doc": "<p></p>\n", "annotation": ": set[str]"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.max_maj_support", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.max_maj_support", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.nan_prop_support", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.nan_prop_support", "kind": "variable", "doc": "<p></p>\n"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.get_vals", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.get_vals", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">tmp_df</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>, </span><span class=\"param\"><span class=\"n\">col_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_baseline_features", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.construct_baseline_features", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">dataframe</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.feature_transformations.ranking_transformers.FeatureTransformerGeneric.construct_new_features", "modulename": "outrank.feature_transformations.ranking_transformers", "qualname": "FeatureTransformerGeneric.construct_new_features", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">dataframe</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_generators", "modulename": "outrank.task_generators", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_generators.logger", "modulename": "outrank.task_generators", "qualname": "logger", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;Logger syn-logger (DEBUG)&gt;"}, {"fullname": "outrank.task_generators.outrank_task_generate_data_set", "modulename": "outrank.task_generators", "qualname": "outrank_task_generate_data_set", "kind": "function", "doc": "<p>Core method for generating data sets</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_instance_ranking", "modulename": "outrank.task_instance_ranking", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_instance_ranking.shannon_ent", "modulename": "outrank.task_instance_ranking", "qualname": "shannon_ent", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">string</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">float</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_instance_ranking.compute_entropy_avg", "modulename": "outrank.task_instance_ranking", "qualname": "compute_entropy_avg", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">line</span><span class=\"p\">:</span> <span class=\"nb\">list</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">float</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_instance_ranking.score_line", "modulename": "outrank.task_instance_ranking", "qualname": "score_line", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">line</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_instance_ranking.outrank_task_rank_instances", "modulename": "outrank.task_instance_ranking", "qualname": "outrank_task_rank_instances", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_ranking", "modulename": "outrank.task_ranking", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_ranking.outrank_task_conduct_ranking", "modulename": "outrank.task_ranking", "qualname": "outrank_task_conduct_ranking", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_selftest", "modulename": "outrank.task_selftest", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_selftest.logger", "modulename": "outrank.task_selftest", "qualname": "logger", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;Logger syn-logger (DEBUG)&gt;"}, {"fullname": "outrank.task_selftest.conduct_self_test", "modulename": "outrank.task_selftest", "qualname": "conduct_self_test", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_summary", "modulename": "outrank.task_summary", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_summary.outrank_task_result_summary", "modulename": "outrank.task_summary", "qualname": "outrank_task_result_summary", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.task_visualization", "modulename": "outrank.task_visualization", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.task_visualization.outrank_task_visualize_results", "modulename": "outrank.task_visualization", "qualname": "outrank_task_visualize_results", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "outrank.visualizations", "modulename": "outrank.visualizations", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.visualizations.ranking_visualization", "modulename": "outrank.visualizations.ranking_visualization", "kind": "module", "doc": "<p></p>\n"}, {"fullname": "outrank.visualizations.ranking_visualization.visualize_hierarchical_clusters", "modulename": "outrank.visualizations.ranking_visualization", "qualname": "visualize_hierarchical_clusters", "kind": "function", "doc": "<p>A method for visualization of hierarchical clusters w.r.t. different linkage functions</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplet_dataframe</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">output_folder</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">image_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;png&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">max_num_clusters</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">100</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.visualizations.ranking_visualization.visualize_heatmap", "modulename": "outrank.visualizations.ranking_visualization", "qualname": "visualize_heatmap", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplets</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">output_folder</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">image_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.visualizations.ranking_visualization.visualize_barplots", "modulename": "outrank.visualizations.ranking_visualization", "qualname": "visualize_barplots", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplets</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">output_folder</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">reference_json</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">image_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">label</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">heuristic</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "outrank.visualizations.ranking_visualization.visualize_all", "modulename": "outrank.visualizations.ranking_visualization", "qualname": "visualize_all", "kind": "function", "doc": "<p>A method for visualization of the obtained feature interaction maps.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">triplets</span><span class=\"p\">:</span> <span class=\"n\">pandas</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">frame</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">output_folder</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">label</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">reference_json</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">image_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;png&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">heuristic</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;MI&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}];
 
     // mirrored in build-search-index.js (part 1)
     // Also split on html tags. this is a cheap heuristic, but good enough.

From cad09f1ba888d01c6c81d750c9a54e2917843bc6 Mon Sep 17 00:00:00 2001
From: 98MM <47939788+98MM@users.noreply.github.com>
Date: Mon, 15 Jul 2024 11:57:46 +0200
Subject: [PATCH 9/9] fixed conflicting file

---
 .../synthetic_data_generators/cc_generator.py | 101 +++++++-----------
 1 file changed, 36 insertions(+), 65 deletions(-)

diff --git a/outrank/algorithms/synthetic_data_generators/cc_generator.py b/outrank/algorithms/synthetic_data_generators/cc_generator.py
index f370580..1084021 100644
--- a/outrank/algorithms/synthetic_data_generators/cc_generator.py
+++ b/outrank/algorithms/synthetic_data_generators/cc_generator.py
@@ -16,13 +16,14 @@
 
 class CategoricalClassification:
 
-    def __init__(self):
+    def __init__(self, seed: int = 42):
+        np.random.seed(seed)
         self.dataset_info = {
             'general': {},
             'combinations': [],
             'correlations': [],
             'duplicates': [],
-            'labels': [],
+            'labels': {},
             'noise': [],
         }
 
@@ -70,8 +71,8 @@ def generate_data(
         np.random.seed(seed)
         X = np.empty([n_features, n_samples])
 
+        # No specific structure parameter passed
         if structure is None:
-            # No specific structure parameter passed
             for i in range(n_features):
                 x = self._generate_feature(
                     n_samples,
@@ -82,16 +83,17 @@ def generate_data(
                     high=high,
                 )
                 X[i] = x
+        # Structure parameter passed, building based on structure
         else:
-            # Structure parameter passed, building based on structure
             ix = 0
             for data in structure:
+
+                # Data in structure is a tuple of (feature index (integer), feature attributes)
                 if not isinstance(data[0], (list, np.ndarray)):
-                    # Data in structure is a tuple of (feature index (integer), feature attributes)
                     feature_ix, feature_attributes = data
 
+                    # Filling out the dataset up to column index feature_ix
                     if ix < feature_ix:
-                        # Filling out the dataset up to column index feature_ix
                         for i in range(ix, feature_ix):
                             x = self._generate_feature(
                                 n_samples,
@@ -115,12 +117,12 @@ def generate_data(
                     X[ix] = x
                     ix += 1
 
+                # Data in structure is a tuple of (list of feature indexes, feature attributes)
                 else:
-                    # Data in structure is a tuple of (list of feature indexes, feature attributes)
                     feature_ixs, feature_attributes = data
 
+                    # Filling out the dataset up to feature_ix
                     for feature_ix in feature_ixs:
-                        # Filling out the dataset up to feature_ix
                         if ix < feature_ix:
                             for i in range(ix, feature_ix):
                                 x = self._generate_feature(
@@ -146,8 +148,8 @@ def generate_data(
                         X[ix] = x
                         ix += 1
 
+            # Fill out the rest of the dataset
             if ix < n_features:
-                # Fill out the rest of the dataset
                 for i in range(ix, n_features):
                     x = self._generate_feature(
                         n_samples,
@@ -182,9 +184,9 @@ def _configure_generate_feature(
         :return: feature vector
         """
 
+        # feature_cardinality is just an integer, generate feature either with random values or
+        # [low, low+cardinality]
         if not isinstance(feature_attributes, (list, np.ndarray)):
-            # feature_cardinality is just an integer, generate feature either with random values or
-            # [low, low+cardinality]
             x = self._generate_feature(
                 n_samples,
                 cardinality=feature_attributes,
@@ -193,8 +195,8 @@ def _configure_generate_feature(
                 low=low,
                 high=high,
             )
+        # feature_cardinality is a list of [value_domain, value_frequencies]
         else:
-            # feature_cardinality is a list of [value_domain, value_frequencies]
             if isinstance(feature_attributes[0], (list, np.ndarray)):
                 value_domain, value_frequencies = feature_attributes
                 x = self._generate_feature(
@@ -203,8 +205,8 @@ def _configure_generate_feature(
                     ensure_rep=ensure_rep,
                     p=value_frequencies,
                 )
+            # feature_cardinality is value_domain (list of values for feature)
             else:
-                # feature_cardinality is value_domain (list of values for feature)
                 value_domain = feature_attributes
                 x = self._generate_feature(
                     n_samples,
@@ -268,7 +270,7 @@ def generate_combinations(
         X: ArrayLike,
         feature_indices: list[int] | ArrayLike,
         combination_function: Optional = None,
-        combination_type: Literal = 'linear',
+        combination_type: Literal['linear', 'nonlinear'] = 'linear',
     ) -> np.ndarray:
         """
         Generates linear, nonlinear, or custom combinations within feature vectors in given dataset X
@@ -436,8 +438,9 @@ def generate_labels(
         p: float | list[float] | ArrayLike = 0.5,
         k: int | float = 2,
         decision_function: Optional = None,
-        class_relation: str = 'linear',
+        class_relation: Literal['linear', 'nonlinear', 'cluster'] = 'linear',
         balance: bool = False,
+        random_state: int = 42,
     ):
         """
         Generates labels for dataset X
@@ -448,6 +451,7 @@ def generate_labels(
         :param decision_function: optional user-defined decision function
         :param class_relation: string, either 'linear', 'nonlinear', or 'cluster'
         :param balance: boolean, whether to balance clustering class labels
+        :param random_state: seed for KMeans clustering, defaults to 42
         :return: array of labels, corresponding to dataset X
         """
 
@@ -513,7 +517,7 @@ def generate_labels(
                 p = 1.0
             else:
                 p = [p, 1 - p]
-            y = self._cluster_data(X, n, p=p, balance=balance)
+            y = self._cluster_data(X, n, p=p, balance=balance, random_state=random_state)
 
         self.dataset_info.update({
             'labels': {
@@ -530,6 +534,7 @@ def _cluster_data(
         n: int,
         p: float | list[float] | ArrayLike | None = 1.0,
         balance: bool = False,
+        random_state: int = 42,
     ) -> np.ndarray:
         """
         Cluster data using kmeans
@@ -537,16 +542,18 @@ def _cluster_data(
         :param n: number of clusters
         :param p: class distribution
         :param balance: balance the clusters according to p
+        :random_state: seed for KMeans clustering, defaults to 42
         :return: array of labels, corresponding to dataset X
         """
 
-        kmeans = KMeans(n_clusters=n)
+        kmeans = KMeans(n_clusters=n, random_state=random_state)
 
         kmeans.fit(X)
 
         cluster_labels = kmeans.labels_
 
-        if not isinstance(p, (list, np.ndarray)):  # Fully balanced clusters
+        # Fully balanced clusters
+        if not isinstance(p, (list, np.ndarray)):
             samples_per_cluster = [len(X) // n] * n
         else:
             samples = len(X)
@@ -572,10 +579,11 @@ def _cluster_data(
                 adjustment = samples_per_cluster[i] - cluster_size
                 adjustments.append(adjustment)
 
-                if adjustment < 0:  # Cluter is too large
-
+                # Cluster is too large
+                if adjustment < 0:
                     centroid = kmeans.cluster_centers_[i]
-                    dataset_indices = np.where(cluster_labels == i)[0]  # Indices of samples in dataset
+                    # Indices of samples in dataset
+                    dataset_indices = np.where(cluster_labels == i)[0]
                     cluster_samples = np.copy(X[dataset_indices])
 
                     distances = np.linalg.norm(
@@ -625,7 +633,7 @@ def generate_noise(
         X: ArrayLike,
         y: list[int] | ArrayLike,
         p: float = 0.2,
-        type: Literal = 'categorical',
+        type: Literal['categorical', 'missing'] = 'categorical',
         missing_val: str | int | float = float('-inf'),
     ) -> np.ndarray:
 
@@ -714,6 +722,9 @@ def generate_noise(
 
             return Xn_T.T
 
+        else:
+            raise ValueError(f'Type {type} not supported')
+
     def downsample_dataset(
         self,
         X: ArrayLike,
@@ -799,47 +810,7 @@ def print_dataset(
             print(f'], Label: {y[n]}')
             n += 1
 
+    """
     def summarize(self):
-
-        print(f"Number of features: {self.dataset_info['general']['n_features']}")
-        print(f"Number of generated samples: {self.dataset_info['general']['n_samples']}")
-        if self.dataset_info['downsampling']:
-            print(
-                f"Dataset downsampled from shape {self.dataset_info['downsampling']['original_shape']}, to shape {self.dataset_info['downsampling']['downsampled_shape']}",
-            )
-        print(f"Number of classes: {self.dataset_info['labels']['n_class']}")
-        print(f"Class relation: {self.dataset_info['labels']['class_relation']}")
-
-        print('-------------------------------------')
-
-        if len(self.dataset_info['combinations']) > 0:
-            print('Combinations:')
-            for comb in self.dataset_info['combinations']:
-                print(
-                    f"Features {comb['feature_indices']} are in {comb['combination_type']} combination, result in {comb['combination_ix']}",
-                )
-            print('-------------------------------------')
-
-        if len(self.dataset_info['correlations']) > 0:
-            print('Correlations:')
-            for corr in self.dataset_info['correlations']:
-                print(
-                    f"Features {corr['feature_indices']} are correlated to {corr['correlated_indices']} with a factor of {corr['correlation_factor']}",
-                )
-            print('-------------------------------------')
-
-        if len(self.dataset_info['duplicates']) > 0:
-            print('Duplicates:')
-            for dup in self.dataset_info['duplicates']:
-                print(
-                    f"Features {dup['feature_indices']} are duplicated, duplicate indexes are {dup['duplicate_indices']}",
-                )
-            print('-------------------------------------')
-
-        if len(self.dataset_info['noise']) > 0:
-            print('Simulated noise:')
-            for noise in self.dataset_info['noise']:
-                print(f"Simulated {noise['type']} noise, amount of {noise['noise_amount']}")
-            print('-------------------------------------')
-
-        print("\nFor more information on dataset structure, print cc.dataset_info['general']['structure']")
+        # TODO: Logging function
+    """