pytoolkit.tablurs module¶
テーブルデータ関連。
- pytoolkit.tablurs.load_labeled_data(data_path, label_col_name)[ソース]¶
ラベルありデータの読み込み
- パラメータ:
data_path (str | PathLike[str]) -- データのパス(CSV, Excelなど)
label_col_name (str) -- ラベルの列名
- 戻り値:
データフレーム
- 戻り値の型:
tuple[polars.dataframe.frame.DataFrame, numpy.ndarray[Any, numpy.dtype[+ScalarType]]]
- pytoolkit.tablurs.load_unlabeled_data(data_path)[ソース]¶
ラベルなしデータの読み込み
- パラメータ:
data_path (str | PathLike[str]) -- データのパス(CSV, Excelなど)
- 戻り値:
データフレーム
- 戻り値の型:
DataFrame
相関係数の高い列を削除。
- パラメータ:
df (DataFrame) --
threshold (float) --
- 戻り値の型:
DataFrame
相関係数の高い列をリストアップ。
- パラメータ:
df (DataFrame) --
threshold (float) --
- 戻り値の型:
list[str]