「データサイエンティストってどんな仕事?」
本記事ではそんな疑問をかかえている方向けに、データサイエンティストの仕事内容を簡単に解説します。
データサイエンティストになる方法や必要なスキルについても触れていますので、データサイエンティストを目指そうと考えている方は参考にしてください。
おすすめデータサイエンス講座/スクール
スクール | |||||
名前 | Aidemy | TechAcademy | AI CONNECT | SAMURAI ENGINEER | キカガク |
授業 | オンライン(自習) | オンライン(自習) | オンライン(自習) | オンライン(自習) | オンライン(講義・自習) |
料金 | 330,000円〜 (料金詳細を見る) | 7,288円/月〜 (料金詳細を見る) | 実質0円〜 (料金詳細を見る) | 72,600円〜 (料金詳細を見る) | 792,000円 (料金詳細を見る) |
概要 | 専属コーチと学んで最短3カ月でAI人材を目指す | 在宅や隙間時間に学べるオンラインスクール。ライフスタイルに合わせやすい | 現役エンジニア講師と転職サポートが充実し、2~3カ月で転職を実現 | オーダーメイドカリキュラムで学ぶことのできるオンラインスクール | 50,000名以上の受講者、満足度90%以上!AI分野の登竜門スクール |
詳細 | 公式HPを見る | 公式HPを見る | 公式HPを見る | 公式HPを見る | 公式HPを見る |
- ビジネスに活用するために、膨大で多様なデータを分析する仕事
- 統計学や機械学習、プログラミングなどのたくさんのスキルが必要
- データアナリストやデータエンジニアなど下位職種からチャレンジするのがおすすめ
(ファイナンシャル・
プランニング技能士)
データサイエンティストとは
データサイエンティストとは、データをもとに洞察を引き出し予測を行うデータ分析の専門家です。
企業に所属するデータサイエンティストがデータの整理や分析を行う目的は、ビジネスに活用するためです。
ビジネス活用の例は、大まかには次の3つとなるでしょう。
- 新しいビジネスの創造を支援
- 業務を改革する
- ビジネス上の課題を解決する
データサイエンティストの仕事内容
データサイエンティストの仕事は、次の6つのプロセスを行います。
- 課題の把握
- データの特定
- データの収集・加工(データ基盤の設計・構築を含む)
- アルゴリズムの選定・モデル構築
- モデルのパフォーマンス測定
- 分析結果を伝達 or システムへ実装
では、プロセスを順番に見ていきましょう。
課題の把握
まず、ビジネス上で解決したい課題を確認します。
たとえばWebサービスを提供している企業において、ユーザーの成約率が以前よりも低下した場合、「ユーザーの成約率を改善したい」ことが課題となります。
データの特定
課題を解決する上で、必要になるデータの種類を特定します。
「ユーザーの成約率が落ちている」原因がレコメンド機能の低下と仮定する場合、レコメンド機能の精度向上のためにどんなデータが必要なのかを特定します。
データの収集・加工
必要なデータを特定できたら、データの収集を行います。
データに変な値が入っていないかを調査し、データの修正・加工作業を行います。
データを収集するシステムがない場合は、データ基盤の設計・構築作業も必要です。
分析モデルの構築
収集したデータを分析するのに適切なアルゴリズムを検討し、分析モデルを構築します。
モデルのパフォーマンス測定
構築したモデルでビジネス上の課題を解決できるか、モデルのパフォーマンスを測定します。
パフォーマンスが芳しくない場合は、収集するデータ種類の変更を含めて、プロセスをやり直します。
最適なモデルの実装 or ビジネス上の提言
最適なモデルから得られた分析結果を、関係者にわかりやすくプレゼンします。
モデルをシステムへ実装する場合もあります。
データサイエンティストに近接する職種
データサイエンティストの仕事の守備範囲を知るには、データサイエンティストに近接する職種を理解しておく必要があります。
ここでは、以下の職種についてデータサイエンティストとの職務の違いを解説します。
- データエンジニア:システムの構築・実装を専門に行う
- データアナリスト:分析専門だがデータの取り扱い範囲は狭くルーチン的
- 機械学習(AI)エンジニア:やることはほぼ一緒だがシステムを作ることに力点をおいている
データエンジニア
データエンジニアは、システムへの実装や運用を専門的に行うエンジニアです。
具体的には、分析に使うデータを蓄積しておくためのデータ基盤を設計・構築し、運用します。
データを特定し、データを収集・加工する過程で、データエンジニアと協業することが多いでしょう。
データアナリスト
分析のプロセスを担う点でデータサイエンティストとデータアナリストは共通していますが、守備範囲はデータサイエンティストよりも狭くなっています。
- 構造化データのみを扱う
- 予めきまったルールで定期的な分析を行う
データサイエンティストは画像や音声、話しことばといった「非構造化データ」も扱う一方、データアナリストが扱うデータ種類は、基本的にエクセルに落とし込める「構造化データ」です。
データサイエンティストは、特定業務のプロセスの改善など、その場限り(繰り返し行わない)のプロジェクトを任されることが多いですが、データアナリストはルーティーンの分析作業を行うことが多いでしょう。
データサイエンティストはデータアナリストよりもクリエイティブ性を求められる、上位の職種といえます。
※企業によっては、データアナリストとデータサイエンティストを同じ職種として扱う場合があります
機械学習(AI)エンジニア
機械学習エンジニアとデータサイエンティストが扱う業務の範囲はほぼ同じです。
ただし機械学習エンジニアは「エンジニア」であり、システムを作る(実装する)という点に力点が置かれています。
検証を終えた最適なモデルをシステムへ実装する作業を担うのであれば、機械学習エンジニアと表現するのが適切かもしれません。
データサイエンティストに必要なスキル
データサイエンティストに必要なスキルは、次の3タイプに分類できます。
- データサイエンス力
- データエンジニアリング力
- ビジネス力
データサイエンティストには上記の能力が3つともすべて必要であるため、カバーするスキルの範囲は膨大です。
では、ひとつずつ解説します。
データサイエンス力
データサイエンス力とは、専門的な分析を行うための能力全般を指します。
- 統計学の基礎知識
- 機械学習を理解
- 複数のアルゴリズムから適切なものを選択できる
- 分析モデルを構築できる
- 自然言語処理や非構造化データ(画像や音声など)を活用できる
統計学や人工知能についての知識をもち、課題に適切なアルゴリズムを使用して分析モデルを構築します。
Excelに入力できるタイプの構造化データだけでなく、画像や音声、話し言葉などの非構造化データも扱います。
データエンジニアリング力
データエンジニアリング力は、システムへ実装しシステムを運用するための能力です。
ただしこれらの業務は「データエンジニア」という職種が専門的に行い、データサイエンティストと分業しているケースがあります。
- データ基盤を設計・構築できる
- クラウドを活用できる
- プログラミングを扱える(データの前処理、モデルの実装等)
- データベースの知識(SQL)がある
扱うデータを定常的に蓄積しておく「データ基盤」を、設計・構築・運用します。
データ基盤としてはクラウドサービスを活用することが多いため、各クラウドサービスの知識も必要でしょう。
データの欠損処理や加工、構築したモデルのシステムへの実装など、プログラミングを活用する場面も多いです。
プログラミング言語のほかにも、SQLなどのデータ操作言語の知識もあるとよいでしょう。
ビジネス力
ビジネス力は、ビジネスの視点からデータ分析を活用していくための能力です。
- 事業に精通しビジネスにおける当該データの意味を理解している
- 専門的なことをわかりやすく伝える
分析の精度を高めるためには、データサイエンティストが事業や業種に精通している必要があります。
データサイエンティストの求人においても「当業界での就業経験がある人」という条件がある場合があり、業界に精通している人は有利といえるでしょう。
データサイエンティストになる方法
データサイエンティストになるルートは、次の3ステップです。
- データサイエンスを学ぶ
- 関連スキルを学ぶ
- 下位の職種にチャレンジする
それぞれのステップを解説します。
1.データサイエンスについて学ぶ
データサイエンティストのコア業務を行うには、統計学や機械学習、ディープラーニングといったデータサイエンスを学ぶ必要があります。
データサイエンスを学ぶ方法は、主に次の2つが考えられるでしょう。
- 大学や大学院で学ぶ
- オンラインの学習プログラムやスクールを利用する
なお、ITの大手企業は修士や博士号をもつ人を採用する傾向があるため、大手企業を目指すのであれば大学院卒が必須です。
2.関連するスキルを習得する
データサイエンスに関連するスキルを学びましょう。
プログラミング
プログラミングは、データを加工したりデータ分析に利用します。
データサイエンス周りでよく使われるプログラミング言語は次のとおりです。
- Python
- R
- SQL
データの視覚化
データを分析したあと、分析結果をビジュアライズ化するツールを利用します。
ツールの使い方に慣れておくとよいでしょう。
- Tableau
- PowerBI
- Excel
3.下位の職種からチャレンジする
データサイエンティストを募集する企業の7割以上は経験者のみを採用するとしている(※)ため、未経験者がデータサイエンティストとして就職できる可能性は低いです。
よって、データアナリストやデータエンジニアなど、下位の職種からチャレンジしてみることをおすすめします。
上記の職種で数年経験を積んだ上で、同じ会社で職種変更をお願いするか、転職活動を行ってみましょう。
(※)出典:データサイエンティストの採用に関するアンケート-データサイエンティスト協会 11P
データサイエンティストの将来性
米国労働統計局(BLS)によると、データサイエンティストの求人数は、2021年~2031年で36%増加すると考えられています。
他の職種よりもかなり速いスピードで増加するため、募集がなくなってしまう心配はなさそうです。
まとめ:データサイエンティストとは
データサイエンティストについてまとめると、次のとおりです。
- ビジネスに活用するために、膨大で多様なデータを分析する仕事
- 統計学や機械学習、プログラミングなどのたくさんのスキルが必要
- データアナリストやデータエンジニアなど下位職種からチャレンジするのがおすすめ
さまざまなスキルセットを必要とする専門職種なので、ハードルは高めといえます。
ただデータアナリストやデータエンジニアからステップアップすることは可能なので、知識とスキルを身に着けてチャレンジすることをおすすめします。