仕事でデータ分析をやっているわけでも Python を触っているわけでもない僕が、なんとなく Kaggle に挑戦してみたくて初めたデータ分析の勉強。
やってもやっても勉強しなければいけないことが見えてきて、僕は本当に前進できているのだろうか?と不安になったので、Python エンジニア育成推進協会の『Python 3 エンジニア認定データ分析試験』というのを受験してきました。
結果は1000点満点中900点だったので、そこそこできた方じゃないかと思います。(700点が合格ライン)
範囲が広いので細かい受験対策みたいなのは正直お伝えできないけれど、振り返ってみてどんな感じで勉強するのが良いかについては話せるので、今回はそんな感じでまとめていきますね!
ちなみに普段データ分析とかしていない人や、最近業務で使い始めたジュニアの方向けの記事になります。
- データ分析のスキルチェックのためにデータ分析試験を受けようと思っている人
- これからデータ分析や機械学習の勉強をしようと思っている人
- 『Python 3 エンジニア認定データ分析試験』を受験しようか悩んでいる人
『Python 3 エンジニア認定データ分析試験』について
Python 3 エンジニア認定データ分析試験は一般社団法人Python エンジニア育成推進協会が実施している Python を使ったデータ分析の基礎力を問う試験です。
試験自体はテストセンターに受験しにいって、パソコンでポチポチ選択式の試験なので、よくあるベンダー試験と同じような形式です。
ざっくりまとめた概要はこちら。
試験名 | Python 3 エンジニア認定データ分析試験 |
---|---|
受験料 | 1万円(税別) / 学割5千円(税別) |
問題数 | 40問 (すべて選択式) |
合格ライン | 70% (28/40問) |
試験センター | オデッセイ |
意外と良心的で、試験範囲はこちらのページにまとまっています。
見て分かるとおり、各分野から1,2問しか出ないので、結構広い範囲の勉強が必要な試験になっています。
データ分析試験の主教材は購入したほうが良い?
試験範囲が書かれているページにも書いてありますが、Python 3 エンジニア認定データ分析試験は主教材として『Pythonによるあたらしいデータ分析の教科書 第2版』という本が指定されています。
実は試験範囲もこの主教材の章立てに合わせて書いてあって、しかも試験はここから出ますと明言されているのでこの教材は必ず買いましょう。
5章については試験範囲になっていないので、1−4章を読みます。
基礎的な内容が多いので「そんなの知ってるよー」というのもたくさんあると思うのですが、範囲が広いので「全然勉強したことなかった」というのも含まれていると思います。
全然勉強したことなかった内容については、この教材に書いてある内容をしっかり勉強しておけば試験対策としては十分です。
例えば僕の場合は Numpy はあまり詳しくなかったので知らない関数がいくつか出てきましたが、Numpy 自体をしっかり勉強しなければ!というよりは、主教材に出てきている関数をしっかり覚えておけばOKです。
他にも僕は線形代数などの数学的なところは未だにわかってませんし、なんなら数式まともに読めませんが、テストでは数学部分は満点でした。
この辺りも数式が読めないので主教材を読むこと自体が辛かったのですが、わからないところはすっ飛ばしてざっと流し読みしたうえで模擬問題を解けば数式がわからなくても答えはわかるようになるので、教材を頑張って読み解きすぎないようにするもの大事だと思います。
というか、この教材は初心者向けではないというか、わかりやすく書いていないというか、初めてデータ分析の勉強する人には全く向いていません。
僕は数冊データ分析の入門書をやった後にこの教材にたどり着いているのですが、事前知識があるからこそ読み解けた部分がたくさんあったなと感じたので、そもそもわかりにくい教材なのです。
これから勉強をしつつ試験合格を狙っていきたい人は主教材に入る前にいくつかデータ分析の入門書をやるのがおすすめですし、ちょこっとわからないところがある人も勉強するなら別の教材を使って勉強するようにしましょう。(おすすめ書籍はこの後に紹介します)
主教材をざっと読み終えることができたら、次はいくつかある模擬問題にチャレンジしてみましょう。
模擬問題の問題がそのまま出るようなことは無かったですが、どんな内容がテストに出るのかを把握するのには最適ですし、私は事前にやっておいて良かったなと感じたので、受験前に実施しておくと良いです。
模擬問題1: PRIME STRATEGY
PRIME STRATEGYには、40問ほど模擬問題と3回分の模擬試験が用意されています。
一部解説動画も用意されているので、わからない部分の理解の助けにもなります。無料で受けることができます。
模擬問題2 : ダイビック
ダイビックでも1回分の模擬試験を受験することができます。(無料)
解説は見れなかったですが、問題としてはこちらの方が試験に近かったと思います。
月額1010円で解説が見れるようになったり、試験勉強の教材が見れるようになったりするようなので、これを使って勉強するのもありかもしれませんね。
データ分析初心者には補助教材が絶対必要
ここからは特に初学者の方向けに、主教材に入る前の勉強におすすめな教材をいくつか紹介しますね。
もちろん全部やってもいいし、1冊だけやって主教材に移るでも良いと思います。ご自分の理解度に合わせてその辺りは調節してくださいね。
スッキリわかるPythonによる機械学習入門
『スッキリわかるPythonによる機械学習入門』は挿絵を挟みながら、データ分析の基本を学ぶことができます。
内容的には pandas を使ったデータの前処理、scikit-learn を使った機械学習(教師あり/教師なし)、matplotlib を使った可視化が含まれているので、試験範囲にも合っています。まずは全体像を抑えたい人におすすめですね。
Python実践 データ分析 100本ノック
入門書を使って概要を押さえると、データ分析分野で勉強しなければいけないことが山ほどあることに気づきます。
そこで、おすすめしたいのがこちらの『Pythone実践 データ分析100本ノック』。
内容的には入門書と同様に pandas, scikit-learn, matplotlib の内容が含まれていますが、タイトル通り様々なシナリオで100本ノックを進めていくので、各ライブラリの使い方を手に覚えさせることができます。
手で覚えちゃえば試験の問題は簡単ですし、実践的にも役に立つ情報なのでおすすめです。
Python実践シリーズは全部で4種類出ています。
試験に関してはデータ分析100本ノックがおすすめですが、その他の本もそれぞれデータ分析・機械学習に関してとっても勉強になりますよ。以下の記事にまとめているので、興味がある人はこちらも読んでみてくださいね。
最短コースでわかる ディープラーニングの数学
数学が全くついて行けない。。。数式見ると吐き気が。。。って人にはこの『最短コースでわかる ディープラーニングの数学』がぴったりかも。
このデータ分析試験に対してはやり過ぎ感が否めないのが正直なところですが、タイトルはディープラーニングだけれども機械学習向けに微分積分やベクトル、指数関数・対数関数あたりから勉強できるので、数学苦手な人が必要な部分だけ数学の勉強をするのに適しています。数学はわかれば楽しいよ!
月額980円で読み放題の Kindle Unlimited を活用すれば安くてたくさん勉強できる
Amazon が提供しているKindle Unlimitedという書籍の読み放題サービスなら、機械学習やデータ分析、 AI に関する書籍も好きなだけ読むことができます。
なにか新しいことを勉強しようとすると、「どんな本を読んだらいいのかな?」「どの本がいいんだろう?」と書籍選びに悩んでしまったり、「本を買ってみたはいいけれどちょっとイメージと違ったなぁ」「こっちじゃなくてあっちの分野の勉強がしたいぞ」なんてこともザラにあります。
特に参考書は値段も3000円くらいすることが多いので、なるべくハズレを引きたくないですよね。
そんな本選びの失敗を避ける方法として、僕は Kindle Unlimited が結構いいなぁと思っています。
- 何冊読んでもたったの月額980円
- スマホ、タブレット、PCで読めるので場所を選ばないしかさばらない
- 蔵書は200万冊以上
- 読み放題だから、読みたいところだけ読んで次にいけるのでタイパもコスパもいい
例えば AI の勉強をしたいとなったら、どんな本を読みたいですか?
ざっと思いつくのはこのあたりのジャンルの本です。
- 最近の AI ブームや今後の展望を知るための本
- ディープラーニングや機械学習についての本
- Python や機械学習関連ライブラリについての本
- SQL や DB についての本
- アプリ開発の本 etc…
でもこれらの本を全部買って読もうとしたら1万円は余裕で超えてしまいます。
しかも、買って読むとなるとどうしても全部読みきりたくなるんですが、興味の無い内容も含まれていたりして頑張って読もうとすると時間を無駄にするかもしれません。
でも、Kindle Unlimited は読み放題サービスなので、適当に読みたそうな内容の本をみつくろって必要なところだけパパっと読んで終わりにしてもいいし、Kindle 本(電子書籍) なので持ち運びや保管場所を気にする必要もなし。スマホやタブレット、PCでどこでも読めちゃいます。
それでいて月額 980 円という本1冊分以下の価格設定なのですが、初月無料や2ヶ月で99円 (たまに3ヶ月の時もある) のキャンペーンが常時開催されているので、お試しで使ってみるのは全然ありです。
解約もぽちぽちっとやるだけで簡単なので、読みたい本が Kindle Unlimited の対象になっているなら、とりあえず軽い気持ちで1,2ヶ月だけ利用してみると、リーズナブルにたくさん勉強できますよ。
僕が新しい分野を勉強するときは最初にKindle Unlimitedで何冊か選んで流し読みして、概要をおさえるようにしてます!
ちょっと読んでみて「あんまりおもしろい分野じゃないなー」って思うことも多いからかなり重宝してます
\ Kindle Unlimited は初月無料 or 2ヶ月99円のキャンペーンをやってるよ /
難易度は高くないけどデータ分析全般の基礎知識が必要
以上、Python 3 エンジニア認定データ分析試験の僕なりの攻略法の紹介でした。
基礎をしっかり勉強したうえで主教材をざっと読み、模擬問題にチャレンジして調整すれば、それほど難しい試験ではありません。
データ分析の基礎ができあがったかをチェックするにはちょうど良い試験なので、ぜひ受験してみてくださいね!