第1回Python3データ分析模擬試験【第39問】解説

第1回Python3データ分析模擬試験第39問

本問題では「scikit-learn」のうち「ハイパーパラメータの最適化」について学びます。

本問題の解説はYouTube動画でもご覧いただけます。
【解説動画】 第1回Python3データ分析模擬試験 第39問
※当解説動画シリーズはPythonエンジニア育成推進協会に認定された「Python 3 エンジニア認定データ分析試験」の参考教材です。

問題

次のスクリプトに関する説明のうち誤っているものはどれか。

from sklearn.datasets import load_iris
from sklearn.model_selection import GridSearchCV
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split

iris = load_iris()
X, y = iris.data, iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=123)
clf = DecisionTreeClassifier()
param_grid = {‘max_depth’: [3, 4, 5]}
cv = GridSearchCV(clf, param_grid=param_grid, cv=10)
cv.fit(X_train, y_train)
y_pred = cv.predict(X_test)

① このスクリプトではハイパーパラメータである決定木の深さをグリッドサーチにより求めている。
② このスクリプトを複数回実行した場合、求められる決定木の深さの最適値は必ず同じ値となる。
③ このスクリプトで用いられているIrisデータセットには、150枚のアヤメの「がく」や「花びら」の長さと幅、そして花の種類が記録されている。
④ このスクリプトでは10分割の交差検証が実行される。
⑤ このスクリプトで求められる決定木の深さの最適値は必ず3から5の整数のいずれかとなる。

解説

※ただいま公開に向けて準備中です。今しばらくお待ちください。