「Python3データ分析模擬試験」で頻出の「回帰」について、本試験でも「迷わず判断できる」というところを目指して、回帰のごく基本の部分に絞って解説します。
本問題の解説はYouTube動画でもご覧いただけます。
【解説動画】 【番外編】超入門・回帰のキモチを理解する
※当解説動画シリーズはPythonエンジニア育成推進協会に認定された「Python 3 エンジニア認定データ分析試験」の参考教材です。
解説
今回は、特に初学者の方に向けて、「回帰」に関するごく基本の概念的な部分に絞って解説します。
右のような問題(選択肢③)の正誤を、皆さんは迷わず判断できるでしょうか。
もし一瞬でも迷ってしまう方には、以下解説がお役に立てるかもしれません。
まず、回帰の定義を教科書で確認しておきましょう。回帰とは「ある値を別の値で説明するタスク」です。
回帰の特徴は「目的変数が連続値となる」ということです。
回帰の体系上の位置づけをみていきます。
右表は第1回Python3データ分析模擬試験【第02問】解説でも用いたものです。
回帰は「教師あり学習」の代表的な手法の1つで、目的変数が連続値の場合が「回帰」、それ以外のカテゴライズされるデータなら「分類」です。
「連続値」という言葉が現れました。日常生活ではまず使わないものだと思います。
「回帰」を理解するために、まず「連続値」を具体的にイメージしていきたいと思います。
この「連続値」を、もっと身近な言葉で表現するとしたら、例えば「連続する数」「数字」と言いかえられます。
次に「連続する数」の、身近な例を考えてみましょう。
たとえば、社会人の方なら、売上金額や年収、学生の方ならテストの点数や身長・体重、スポーツならマラソンのタイムや野球の打席数…など、さまざまな「数」の例が挙げられると思います。
ここで、最初に確認した回帰の定義に戻ってみます。
「回帰とは、ある値(目的変数)を別の値で説明するタスク」。
定義の中にある「ある値」の部分が、例えば売上金額やテストの点数。それを「別の値」で説明するものが「回帰」である…。
具体例を見てみましょう。右の例題は、回帰の例として正しい内容といえるでしょうか?
「点数」「期間」という「値」を、「年収」という「別の値」で説明しているので、回帰の例として正しい内容であるといえます。
ではもう一つの具体例です。右の例題は、回帰の例として正しい内容といえるでしょうか?
「職種」という「数値ではないもの」を、「金額」という「値」で説明しているため誤りの内容です。
今までよりも、より具体的に「『数値』で『数値』を説明する」ということ、つまり「回帰」をイメージしやすくなったのではと思いますがいかがでしょうか。
【番外編】超入門「回帰のキモチを理解する」の解説は以上です。