学習、予測の実行¶
本項では、学習、予測の実行について、SAMPO/FABとsklearn-fabにおける実現方法およびスクリプトの差異を示します。
学習¶
学習の実行前に、loggingの設定を行うことで、学習時の進捗を確認することができます。
SAMPO/FAB |
sklearn-fab |
---|---|
loggingの設定¶
import logging
from sampo.api import sampo_logging
sampo_logging.configure(level=logging.INFO)
|
loggingの設定¶
import logging
logging.basicConfig(level=logging.INFO)
|
from sampo.api gen_src, process_runner, process_store
train_src = gen_src(template=train_src_temp, params={'data_df': train_data, 'asd': asd})
pstore_url = 'pstore_rg'
process_store.create(pstore_url)
# 学習の実行
process_runner.run(spd=spd, src=train_src, pstore_url=pstore_url)
|
sklearn.pipeline.Pipelineを使用しない場合¶
train_data = pd.DataFrame(scaler.fit_transform(train_data),
columns=train_data.columns.values)
X_train = train_data.iloc[:, 1:]
y_train = train_data.iloc[:, 0]
# 学習の実行
estimator.fit(X_train, y_train)
sklearn.pipeline.Pipelineを使用した場合¶
X_train = train_data.iloc[:, 1:]
y_train = train_data.iloc[:, 0]
# 学習の実行
pipeline.fit(X_train, y_train)
|
予測¶
SAMPO/FAB |
sklearn-fab |
---|---|
train_proc_name = 'train'
predict_src = gen_src(template=predict_src_temp, params={'model_process': train_proc_name,
'data_df': predict_data, 'asd': asd})
# 予測の実行
process_runner.run(src=predict_src, pstore_url=pstore_url)
|
sklearn.pipeline.Pipelineを使用しない場合¶
predict_data = pd.DataFrame(scaler.fit_transform(predict_data),
columns=predict_data.columns.values)
X_predict = predict_data.iloc[:, 1:]
y_predict = predict_data.iloc[:, 0]
# 予測の実行
predict_value = estimator.predict(X_predict)
sklearn.pipeline.Pipelineを使用した場合¶
X_predict = predict_data.iloc[:, 1:]
y_predict = predict_data.iloc[:, 0]
# 予測の実行
predict_value = pipeline.predict(X_predict)
|