第1回Python3データ分析模擬試験【第36問】解説

第1回Python3データ分析模擬試験第36問

本問題では「scikit-learn」のうちボストン住宅価格データセットを用いた回帰について学びます。

本問題の解説はYouTube動画でもご覧いただけます。
【解説動画】 第1回Python3データ分析模擬試験 第36問
※当解説動画シリーズはPythonエンジニア育成推進協会に認定された「Python 3 エンジニア認定データ分析試験」の参考教材です。

問題

次のスクリプトに関する説明のうち誤っているものはどれか。

from sklearn.linear_model import LinearRegression
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split

boston = load_boston()
X, y = boston.data, boston.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=123)
lr = LinearRegression()
lr.fit(X_train, y_train )
y_pred = lr.predict(X_test)

① このスクリプトは米国ボストン市郊外の地域別に、住宅価格と特徴量を記録したデータセットを用いて線形回帰を行うものである。
② このスクリプトで行う回帰は住宅価格を特徴量から求める単回帰である。
③ データセットは学習用が7割、テスト用が3割の比率で分割される。
④ X_trainは学習用の説明変数、y_trainは学習用の目的変数である。
⑤ このスクリプトの最終行では、学習したモデルを用いてテスト用の説明変数から予測される目的変数を取得している。

解説

※ただいま公開に向けて準備中です。今しばらくお待ちください。