本問題では「pandas」のうち「データ(CSV、Excel、HTML、バイナリ)の読み込み・書き込み、pickleモジュールによるデータの再利用」について学びます。
本問題の解説はYouTube動画でもご覧いただけます。
【解説動画】 第1回Python3データ分析模擬試験 第21問
※当解説動画シリーズはPythonエンジニア育成推進協会に認定された「Python 3 エンジニア認定データ分析試験」の参考教材です。
問題
pandasのデータの読み込みと書き込みに関する次の記述のうち誤っているものはどれか。
① CSVファイルからのデータの読み込みは、read_csvメソッドを、CSVファイルへのデータの書き込みはto_csvメソッドを用いることができる。
② Execlファイルからのデータの読み込みは、read_excelメソッドを、Excelファイルへのデータの書き込みはto_excelメソッドを用いることができる。
③ WebサイトのHTML内のtable要素からのデータの読み込みは、read_htmlメソッドを、htmlファイルへのデータの書き込みはto_htmlメソッドを用いることができる。
④ バイナリファイルからのデータの読み込みは、read_blobメソッドを、バイナリファイルへのデータの書き込みはto_blobメソッドを用いることができる。
⑤ DataFrameを直列化してファイルとして保存し、再利用するためにpickleモジュールを利用することができる。
解説
正解は選択肢④です。以下解説します。
pandasのデータ読み込みと書き込み
選択肢を確認する前に、pandasのデータの読み込み書き込みについて教科書の範囲で整理します。
pandasのDataFrameやSeriesは、2次元や1次元の表で表せるオブジェクトです。csvファイルやエクセルファイル、HTMLファイルのテーブル要素などの読み込みと書き込みを行うことができます。
また、csvやエクセル、htmlは、それぞれのエディタで中身を確認できるものですが、例えば人間がデータの中身を確認する必要がなく、効率的にデータを再利用したい場合には、Python標準ライブラリのpickleモジュールを使うのが便利です。
それぞれのデータの読み込みと書き込みは、右表のメソッドで行えます。
pickleモジュールはデータを再利用するために、凍結・変換(直列化)と保存(永続化)を行うものです。
処理のイメージは右図の通りです。Pythonプログラムで生成したデータを直列化して保存したり、読み込んで再利用したりということが行われています。
選択肢①
選択肢①は正しい肢です。文章中のメソッドは先ほど確認した通りです。
選択肢②
選択肢②も正しい肢です。文章中のメソッドは先ほど同様、確認した通りです。
選択肢③
選択肢③も正しい肢です。文章中のメソッドはこちらも先ほど同様、確認した通りです。
選択肢④
選択肢④は誤りの肢です。文章中のメソッド名が間違っています。正しくは、read_pickle、to_pickleです。
選択肢⑤
選択肢⑤は正しい肢です。pickleモジュールの特徴が正しく述べられています。
第1回Python3データ分析模擬試験第21問の解説は以上です。