第1回Python3データ分析模擬試験 【番外編】超入門「回帰のキモチを理解する」解説

【番外編】回帰のキモチを理解する

「Python3データ分析模擬試験」で頻出の「回帰」について、本試験でも「迷わず判断できる」というところを目指して、回帰のごく基本の部分に絞って解説します。

本問題の解説はYouTube動画でもご覧いただけます。
【解説動画】 【番外編】超入門・回帰のキモチを理解する
※当解説動画シリーズはPythonエンジニア育成推進協会に認定された「Python 3 エンジニア認定データ分析試験」の参考教材です。

解説

今回は、特に初学者の方に向けて、「回帰」に関するごく基本の概念的な部分に絞って解説します。

教師あり学習は説明変数の種類により回帰と分類に分けられる。

右のような問題(選択肢③)の正誤を、皆さんは迷わず判断できるでしょうか。

もし一瞬でも迷ってしまう方には、以下解説がお役に立てるかもしれません。

回帰の定義と特徴

まず、回帰の定義を教科書で確認しておきましょう。回帰とは「ある値を別の値で説明するタスク」です。

回帰の特徴は「目的変数が連続値となる」ということです。

回帰の体系上の位置づけをみていきます。

右表は第1回Python3データ分析模擬試験【第02問】解説でも用いたものです。

回帰は「教師あり学習」の代表的な手法の1つで、目的変数が連続値の場合が「回帰」、それ以外のカテゴライズされるデータなら「分類」です。

連続値」という言葉が現れました。日常生活ではまず使わないものだと思います。

「回帰」を理解するために、まず「連続値」を具体的にイメージしていきたいと思います。

連続値のイメージ

この「連続値」を、もっと身近な言葉で表現するとしたら、例えば「連続する数」「数字」と言いかえられます。

連続値の身近な例

次に「連続する数」の、身近な例を考えてみましょう。

たとえば、社会人の方なら、売上金額や年収、学生の方ならテストの点数や身長・体重、スポーツならマラソンのタイムや野球の打席数…など、さまざまな「数」の例が挙げられると思います。

連続値の身近な例と回帰の定義

ここで、最初に確認した回帰の定義に戻ってみます。

「回帰とは、ある値(目的変数)を別の値で説明するタスク」。

定義の中にある「ある値」の部分が、例えば売上金額やテストの点数。それを「別の値」で説明するものが「回帰」である…。

回帰の例①

具体例を見てみましょう。右の例題は、回帰の例として正しい内容といえるでしょうか?

「点数」「期間」という「」を、「年収」という「別の値」で説明しているので、回帰の例として正しい内容であるといえます。

回帰の例②

ではもう一つの具体例です。右の例題は、回帰の例として正しい内容といえるでしょうか?

「職種」という「数値ではないもの」を、「金額」という「」で説明しているため誤りの内容です。


今までよりも、より具体的に「『数値』で『数値』を説明する」ということ、つまり「回帰」をイメージしやすくなったのではと思いますがいかがでしょうか。

【番外編】超入門「回帰のキモチを理解する」の解説は以上です。