データサイエンス

データサイエンティストになるために必要な勉強は?私がやった4つのこと!

本記事では、データサイエンティストを目指す初心者に向けたオススメの勉強方法を解説しています。

本記事のポイント
  • データサイエンティストになるために必要なスキル
  • スキルを習得するための勉強法
  • 私が実際にやったオススメの勉強法

今までのキャリアを辞め他のキャリアにチャレンジする際には、なりたいキャリアに直結する勉強を進めていく必要があります。ここ数年で知名度が広がり、アメリカでは大学卒業者にもっとも人気の職業であるデータサイエンティストも同様です。

日本でも広く知られているわけではありませんので、実際にデータサイエンティストになるためにはどのような勉強をしていけばよいのかわからない人も多いでしょう。

実際に必要な勉強内容と、私がどの程度の時間をかけどうやって学習していったかを解説していきますので、これから勉強を始める方は参考にしてください。

データサイエンティストになるために必要な勉強内容とは?

数学

データサイエンティストは膨大なデータを分析し、その結果を企業の戦略に生かしていく仕事のため、数学の知識が必要になります。実際に分析は機械学習を用いて進めますが、その機械学習には線形代数や微分積分、確率統計の知識が不可欠です。

元々理系で大学を卒業していれば、大学1,2年レベルのため復習したとしてもそれほど大変ではないかもしれませんが、文系や大学で学んでいない場合には少し大変かもしれませんね。

プログラミングスキル

データサイエンティストがデータを分析する際には、とても大きなボリュームのデータを処理する必要があるため、人間の手や目だけに頼っていては終わりません。そのため、数学の項でも記載したように、機械学習を用いて分析をします。

機械学習を分析したいデータに合わせて変更する必要があるため、プログラミング言語の習得は必要不可欠です。具体的には、Pythonという言語が機械学習には多く使われているため、集中して学習しておくべきでしょう。

ドメイン知識

ドメイン知識と言われても何のことを言っているのかパッとわからない人も多いでしょう。何となくURLのような感じかな?とイメージしてしまいます。

ドメイン知識とは、データサイエンティストとして仕事をする業界の知識や動向のことです。多量なデータを分析する際に、どのように使いたいのか?という点を明確に理解できていないと適切な分析ができません。

きちんと適用する業界の知識を持ち合わせておくことで、データサイエンティストとしての能力を発揮できます。

データサイエンティストに必要な勉強時間

データサイエンティストになるために勉強すべき内容は明確になりましたが、実際にはどれくらいの勉強時間がかかるのでしょうか?これは、元々の知識や経験、スキルがどの程度あるのかによって大きく異なります。

また、吸収力は人によって異なるため一概に言えません。大手プログラミングスクールの1つであるTECH::CAMPではこのようなことが言われています。

Q: 自分でWebサービス(食べログやAmazonのようなサービス)を作成できるだけの技術力を身につけたいと思っています。合計どのくらいの学習時間確保が必要ですか?

A: 合計100時間の学習時間を確保いただく必要があります。 これは基本カリキュラムを終えて、サービスのプロトタイプ(試作品)を作成し始めるという段階に達するための目安時間となります。

参考:https://tech-camp.in/faq_categories/1

この例はWebアプリケーションを想定していますが、データサイエンティストも最低これくらいは覚悟しておきましょう。

バックグラウンドも人によって様々ですので、先ほど紹介した数学・プログラミング・ドメイン知識に関して不足している部分を補っていきましょう。まずは不足分を明確にすることから始めることをおすすめします。

この中で、もっとも時間がかかるのがプログラミングです。未経験の場合には、きちんと時間を取って勉強をする必要がありますので、独学の場合には数百時間はかかってしまいます。ただ、プログラミングも向き不向きがありますので、人によって必要な勉強時間に幅はあります。

次に時間がかかるのが数学だと思っています。理系でも特に確率統計などは苦手な人が多い科目ですし、高校卒業レベルから勉強をするとして、こちらも百時間以上はかかります。

ドメイン知識は、いずれにせよ就職先の企業によって異なりますので、事前の勉強は業界全体を把握する程度でよいでしょう。複数の業界を見るとしても、数十時間もあれば十分です。

実際に私がやったデータサイエンスの勉強方法

無料オンライン教材で学ぶ

特にプログラミングに関して、ここ数年でオンラインの教材が充実しており、有料サイトの体験版として無料教材が増えてきています。どのような内容を学べばよいのか感覚を掴むために活用しました。

Aidemy

人工知能プログラミングを学ぶためのサイトなので、数あるプログラミング言語の中でも機械学習に用いるPythonの講座は充実しています。パソコンの環境構築は必要なくオンライン上で完結するため、手軽に始められます。

理論よりもまず実践を重視しているため、数学の知識を身につける前だったとしてもゴリゴリ進めれるという大きな特徴があります。Pythonの入門コースがありますので、ライブラリの使い方も含めてこちらで学んでいきました。

>>Aidemy公式

また、AidemyにはAidemy Premium Planというプログラミングスクールを抱えています。こちらは現役のデータサイエンティストから直接教えてもらうことができるプランです。
>>Aidemy Premium Plan公式

Progate

Aidemyに比べるとProgateは人工知能や機械学習に重点を置いているわけではなく、幅広くプログラミング言語全体の学習ができるサイトです。有料版に申し込むことで多くの講座を受講できますが、無料でも基礎的な部分は抑えられます。

こちらもオンライン上で完結するため特に環境構築は不要で、手軽に始められます。私が重宝したのは、スマホとも連携して学習を進められるため、外出中の隙間時間を有効活用できた点です。かなり学習の効率を上げることができました。

>>progate公式

書籍で学ぶ

プログラミングの基礎的な部分を実践的に学ぶのはオンラインの無料教材でも十分ですが、より理論的な部分を体系的に学ぼうと思うと、少しハードルが高いです。

私の場合には、何冊かの書籍で学んでいきましたので解説します。

やさしく学ぶ 機械学習を理解するための数学のきほん ~アヤノ&ミオと一緒に学ぶ 機械学習の理論と数学、実装まで~

文字ばかりの堅苦しい本で学ばなければいけないかと憂鬱になっているときにこの本に出会いました。会話形式で機械学習に用いる数学について学び、実際にどう使っていくのかをイメージしながら進めていけるため、入り込みやすい本です。

多くの数学のテキストは途中の計算式が省かれていて理解が進まない場合も多いのですが、後から見返したときに冗長だなと感じるレベルで書かれていますので、苦手な人でもなんとか食らいついていける本です。

[第2版]Python 機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)

とりあえずデータサイエンティストを目指すうえで、タイトルに入っているから有益そうだなと思って学習の初期段階で購入しましたが、最初はチンプンカンプンでよくわかりませんでした。数学やPythonの基礎知識が必要です。

しばらく、より基礎的な部分を学習した後に戻ってくると理論だけではなくデータサイエンティストとして機械学習を使っていく為にはどう実装していくか?という部分も書かれているため、他の文献と合わせて使うのが有効です。

はじめてのパターン認識

機械学習とはどのようなものなのか?というところを広く浅く学習するためには本書が役立ちました。学習すべき内容が多岐にわたる中で、それぞれ出てくるたびに深く勉強していては、先が見えなくなってしまいます。

その点、本書は深い説明やプログラミングのコードまで言及することはなく、全体を俯瞰したように理解を進められます。実践中心で理論が不十分になっていると感じる人には、おすすめしたい書籍です。一度読んでみると理解度が高まります。

パターン認識と機械学習 上下

上下巻構成でそれぞれの価格もかなり高いため、購入までのハードルも高いかもしれません。しかし、入門書ではありますが、入門を通過しよりレベルアップするためには必要不可欠な書籍です。大学で関連分野を専攻していた友人に勧められて購入しました。

おすすめの本ではあるのですが、事実としてかなり読み進めていくのは厳しいので、先駆者に確認する環境を整えたり、時間をしっかり確保して気合を入れて取り組んでいく必要があります。

動画で学ぶ

最近はオンライン教材も充実しており、動画で簡単に学ぶことができます。今回はお勧めだけをピックアップして紹介します。

【神】私が受講したUdemyでおすすめの機械学習の講座を徹底解説【体験談】これから機械学習を学びたい、でも学び方がわからない。という人に向けた記事です。 本や無料オンライン教材で学びたい方はこちらの記事を...

【キカガク流】人工知能・機械学習 脱ブラックボックス講座 – 初級編 –

4.5時間にわたる動画教材で、脱ブラックボックスセミナーとしては既に1,000人以上が受講している実績ある教材の機械学習版です。機械学習の勉強を始めようと思ったけれども参考書を閉じて開かなくなった人の再学習を想定して設定されています。

数学の基礎からPythonの実装まで、入門レベルでも学べますし、15,000円という受講料もセミナーの時間やデータサイエンティストとして活躍する際の給料を考えればそれほど高すぎるということはないでしょう。
Udemyの講座ならセールをやっていることがありますので、セール中を狙って購入しましょう。
>>人工知能・機械学習 脱ブラックボックス講座

【世界で5万人が受講】実践 Python データサイエンス

Pythonを用いながらデータサイエンスに関する幅広い知識を学ぶことができる講座で、17.5時間と非常にボリュームが大きいながらも12,600円とリーズナブルに受講できる点が特徴です。

Pythonで用意されているライブラリを上手く使ってデータ分析をしていくためにはどのようにすればよいのか?という点を学べますので、これから学習する人はもちろんですが、既に働いている人のスキルアップとしても有用な講座といえます。
>>【世界で5万人が受講】実践 Python データサイエンス・オンライン講座

【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門

今回紹介する動画教材の中では19,800円と最も高いですが、ビジネスにおいてより実践的な内容を学ぶことができるため、仕事の内容をイメージしながら学習を進められます。ボリュームも8時間分とかなり大きいです。

実践をイメージしていますが、対象はデータサイエンティストを目指しているが何を学んだらよいかわからない人や、プログラミング初心者を対象としているため、まずこの講座に申し込んでみるのもよいでしょう。
>>【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門

プログラミングスクールで学ぶ

ここ数年のIT人材のニーズが高まりによって、プログラミングスクールが多く誕生しており、各社特徴を持ったサービスを展開しています。

特に最近人気が高まっているのはワンストップのサービスで、初心者がスクールで学びスキルを身につけ、就職の支援までしてくれるプログラミングスクールも増えてきています。それも有名企業やスタートアップへの採用も狙えるため、とても魅力的です。

データサイエンティストのプログラミングスクールおすすめ比較!AI・機械学習が学べる【2020年完全保存版】この記事はデータサイエンティストになりたい、AIについて学びたい、という人向けのプログラミングスクールと、その選び方を紹介しています。自...

独学で勉強をしたとしても、書籍や動画で実践的な内容を学ぶことには限界がありますし、能力をアピールする資格があるわけではないので、企業も採用しにくいですよね。その点スクールの卒業生であれば、一定の実力があることは判断できます。

オンラインで講座を学んだり、無制限で現役エンジニアに質問できたり、学習期間は寮に入って学ぶことができたりと魅力的なスクールが増えてきています。

まとめ:データサイエンティストになりたいならスクールでの勉強がおすすめ

さまざまな勉強方法をご紹介してきましたが結論からいうと、データサイエンティストになるために勉強をするならプログラミングスクールに通うことをオススメします。

データサイエンティストのプログラミングスクールおすすめ比較!AI・機械学習が学べる【2020年完全保存版】この記事はデータサイエンティストになりたい、AIについて学びたい、という人向けのプログラミングスクールと、その選び方を紹介しています。自...

データサイエンスを単に学びたいだけであれば、独学で書籍や動画教材を上手く活用していけば、スキルを身につけていくことは可能です。しかし、それだけでは外に対して実力を十分にアピールすることは簡単ではありません。

実際にデータサイエンティストとして働く為には、就職先の企業に対して自分の実力を証明する必要があります。明確な資格などがなく、前職での経験もない以上個人でアピールすることは困難です。
プログラミングスクールであれば、講座の内容を採用したい企業が把握していることもあるため、企業側としてもある程度の実力は担保された状態の人材を確保できます。

最近は、スクール経由で就職をすればスクールの受講料を採用先の企業が代わりに払ってくれるようなスクールもありますし、国の機関からサポートがある講座も存在していますので、仮にお金がなかったとしても諦めずにチャレンジするのが良いでしょう。