pytoolkit.tablurs module

テーブルデータ関連。

pytoolkit.tablurs.load_labeled_data(data_path, label_col_name)[ソース]

ラベルありデータの読み込み

パラメータ:
  • data_path (str | PathLike[str]) -- データのパス(CSV, Excelなど)

  • label_col_name (str) -- ラベルの列名

戻り値:

データフレーム

戻り値の型:

tuple[polars.dataframe.frame.DataFrame, numpy.ndarray[Any, numpy.dtype[+ScalarType]]]

pytoolkit.tablurs.load_unlabeled_data(data_path)[ソース]

ラベルなしデータの読み込み

パラメータ:

data_path (str | PathLike[str]) -- データのパス(CSV, Excelなど)

戻り値:

データフレーム

戻り値の型:

DataFrame

pytoolkit.tablurs.remove_correlated(df, threshold=0.9)[ソース]

相関係数の高い列を削除。

パラメータ:
  • df (DataFrame) --

  • threshold (float) --

戻り値の型:

DataFrame

pytoolkit.tablurs.detect_correlated(df, threshold=0.9)[ソース]

相関係数の高い列をリストアップ。

パラメータ:
  • df (DataFrame) --

  • threshold (float) --

戻り値の型:

list[str]