データサイエンティストを目指す方へ向けて、取得しておきたい資格について解説します。
インターネット・SNS・スマホなどの急速な発展やAI分野の開発が盛んな現在、多種多様な大量のデータが日々生み出されています。
データを分析するエンジニアとして需要が増すデータサイエンティストは、ITエンジニアのキャリアの中でも注目度が高まっています。
1. データサイエンティストとは
データサイエンティストは、大量のデータを収集・分析して、データの情報から様々な仮説を立てて検証することで、新たなビジネスソリューションを提案するエンジニアです。
例を挙げると、
◆ サイトへのアクセスログや購買履歴などのデータを分析して得た情報を活かして新たなマーケティングを実践する
◆ IoTセンサーから収集されるデータを見える化して新たなビジネス戦略へ繋げる
このように、集められたビックデータを分析し、その結果をビジネスにフィードバックすることに関心が寄せられています。
分析方法は、ExcelやAccessといった一般的なものから、SQLを利用したデータ分析や、各種分析ツールを利用して行います。
分析だけではなく、そのデータに意味を持たせ、ビジネス戦略の仮説から考察、提案までの一連の流れをつかむことが求められます。
したがって、データサイエンティストには、データ分析に必要な統計学や数学の知識に加えて、消費者心理や行動経済学、マーケティング手法など、ITスキル以外にも幅広い知識が必要です。
ビックデータという言葉が浸透してきた現在、データに価値を見出し経営戦略に活かすデータサイエンティストの需要はますます高まっており、今後も継続して拡大していくと予想されています。
2. データサイエンティストの仕事内容
データサイエンティストの実際の仕事内容についてまとめました。
・要件定義
顧客が抱えている課題を明確に把握し、データ分析によって、どのようなこと実現したいのかをヒアリングします。
・データ収集・抽出、加工
必要となるデータを収集し、データベースに保管します。
収集したデータのままでは体裁が整っていないことがほとんどのため、不要な情報をカットしたり、分析しやすいようにデータの加工を行います。
ExcelやAccess、SQLのほか、PythonやLinuxコマンドによるデータ処理を行うこともあります。
・データ集計・分析
データ集計し、分析を行います。
どのような観点で集計をすればビジネスに活かせるか、集計結果から見えてくる潜在的要素について、様々な角度からの視点がカギとなります。
・問題改善策提案
統計処理を実施してデータを見える化し、データの客観的な知見によって、顧客が抱えている問題点の解決策を導きます。
3 データサイエンティストが取得したい資格
データサイエンティストになるために資格は特に必要ありません。
しかし、仕事を進めていくにあたっては、求められる知識やスキルを習得するために、関連する資格取得を視野に入れてみてはいかがでしょうか。
資格は、スキルを客観的に証明する手段としてだけではなく、体系的に学べる機会としても非常に有効です。
では、データサイエンティストに有効な資格をいくつかみていきましょう。
なお、各資格に記載している難易度(レベル)については、以下の資料に記載されているレベルを参照しています。
参考URL:
ITSSキャリアフレームワークと認定試験・資格の関係(ISV Map Ver10r3)
3.1 基本情報処理技術者試験/応用情報技術者試験
データサイエンティストのみならず、ITエンジニアであればまず取得しておきたい資格として、基本情報処理技術者試験、およびその上位資格として応用情報技術者試験があります。
情報基礎理論・開発技術・プロジェクトマネジメント・SQL・プログラミングなど、試験内容はITスキルを幅広く網羅しています。 後述するデータベース関連の資格を検討する前に、ぜひ取得しておきたい資格です。
資格名 | 受験前提条件 | 受験料(税込) | 難易度 |
---|---|---|---|
基本情報処理技術者試験 | なし | 5,700円 | レベル 2 |
応用情報技術者試験 | なし | 5,700円 | レベル 3 |
基本情報処理技術者試験、および応用情報技術者試験の詳細については、以下の記事においても紹介していますので、是非参考にしてください。
3.2 OSS-DB技術者認定試験
OSS-DB技術者認定試験は、オープンソースデータベースに関する技術者を認定する資格です。
インフラエンジニアの資格としても有名なLinuCを主催する、特定非営利活動法人エルピーアイジャパンによる資格で、SilverとGoldの2つのレベルがあります。
データベースの資格としてはオラクルマスターが有名ですが、OSS-DB技術者認定試験はオープンソースデータベースに関連する試験である点が異なります。
レベル | 受験前提条件 | 受験料(税込) | 難易度 |
---|---|---|---|
Silver | なし | 15,000円 | レベル 2 |
Gold | 受験のための前提条件はなし ※ただしGold取得にはSilverの取得が必要 |
15,000円 | レベル 3 |
受験のみであれば、Goldを先に受験しても良いですが、Gold資格を得るためにはSilverを取得している必要があります。受験方法や試験範囲などの詳細については、公式サイトをご確認ください。
公式サイト:特定非営利活動法人エルピーアイジャパン
オープンソースデータベース技術者認定資格(OSS-DB技術者認定資格)
3.3 オラクルマスター
オラクル社が主催する、Oracle Databaseに関する資格として有名なオラクルマスターは、SEやプログラマーの間でも人気のベンダー資格です。
データベースの構築運用、SQLによるデータの抽出や、DB管理の概要を学べる世界共通の試験となっています。
2020年1月以降の試験からORACLE MASTER新資格体系が導入されました。
出題範囲・試験内容については、より今の時代のDB技術者に必要なスキルに沿った内容で更新されています。
認定資格 | 受験前提条件 | 証明するスキル | 難易度 |
---|---|---|---|
ORACLE MASTER Bronze DBA |
なし | DBの基礎知識 | レベル 1 |
ORACLE MASTER Silver DBA |
なし | 日常の運用管理・基本的なSQL | レベル 2 |
ORACLE MASTER Silver SQL |
なし | SQLの知識全般 | レベル 2 |
ORACLE MASTER Gold SQL |
Silver DBA取得済 | マルチテナント環境・アーキテクチャ、 バックアップ・リカバリ、 インストール・アップグレード、 18c,19cの新機能概要 |
レベル 3 |
*ORACLE MASTER Platinum DBA |
未定 | 高可用性、セキュリティ、性能管理 | レベル 4 |
*ORACLE MASTER Platinum DBAについての詳細は未定となっています。
新資格体系への移行により、受験前提条件の緩和や、出題範囲の変更などがあります。詳細は公式サイトで確認してください。
公式サイト:ORACLE MASTER Portal
3.4 G検定(ジェネラリスト検定)・E資格(エンジニア資格)
G検定・E資格は、一般財団法人日本ディープラーニング協会(JDLA)が提供するAI分野の機械学習やディープラーニングの知識やスキルを証明する資格試験です。
◆ G検定(ジェネラリスト検定)
G検定では、ディープラーニングの基礎知識をベースとし、適切な活用方針を決定して事業活用する能力や知識を有するジェネラリストとしてのスキルを測ることができます。
試験では、人工知能分野の問題・動向、機械学習の具体的手法、ディープラーニングの概要・研究分野・手法・応用などについて問われます。
公式サイト:G検定(日本ディープラーニング協会)
◆ E資格(エンジニア資格)
E資格は、エンジニア向けの試験であり、ディープラーニング理論の理解や、適切な手法を選択して実装する能力や知識を測ることができます。
試験では、応用数学、機械学習、深層学習、開発・運用環境の知識などについて問われます。
なお、E資格を受験するためにはJDLA指定の認定プログラム講座を受講する必要があります。
公式サイト:E資格(日本ディープラーニング協会)
G検定・E資格で身につく機械学習・ディープラーニングの知識や能力は、データサイエンティストに求められる「データサイエンス力」「データエンジニア力」の中でも非常に重要視されるスキルです。
3.5 統計検定
統計検定とは、統計に関する知識および活用力を証明する全国統一試験です。
試験の種別 | 試験内容・難易度 |
---|---|
4級 | 中学程度のデータや表・グラフ、確率に関する基本的な知識と具体的な文脈の中での活用力 |
3級 | 高校程度のデータ分析における重要な概念を身近な問題に活かす力 |
2級 | 大学基礎課程程度の統計学の知識と問題解決力 |
準1級 | 2級までの基礎力をベースとした統計学の活用力 ─ データサイエンスの基礎 |
1級 | 実社会の様々な分野でのデータ解析を遂行する統計専門力 「統計数理」と「統計応用」の2つの試験で構成されており両者に合格することが必須 |
統計調査士 | 統計検定3級合格程度の基礎知識に加え、社会人に求められる公的統計の理解とその活用力の修得 |
専門統計調査士 | 統計検定2級合格程度の専門知識に加え、社会・経済で広く利用される統計や各種の調査データの総合的な知識水準 |
*データサイエンス基礎(CBT) | 分析目的に応じて解析手法を選択し、Excelによるデータの前処理から解析の実践、出力から必要な情報を適切に読み取り、当初の問題の解決のための解釈を行う一連の能力が問われる / 新学習指導要領に対応した大学入試までの内容(データハンドリング技能・データ解析技能・解析結果の適切な解釈) |
*データサイエンス応用(CBT) | 数理、計算、統計、倫理に関する大学教養レベルの内容 / 計算、統計、モデリング、領域知識に関する大学専門レベルの内容 |
*データサイエンス基礎は2020年5月に試験が配信される予定であり、データサイエンス応用は2020年10月にベータ版の試験が配信予定です(2020年4月現在)。
【試験方式】
試験方式として、紙媒体での試験とCBT(Computer Based Testing)方式があります。
CBTとはCBT会場でコンピューターを使って検定を受験するシステムです。
なお、2級、3級検定もCBT方式で受験することが可能です。
【試験実施日程】
例年、6月に準1級・2級・3級・4級、11月に1級・2級・3級・4級・統計調査士・専門統計調査士の試験が実施されています。
次回の試験日は2020年11月22日(日)予定です(2020年6月21日の試験は中止)
公式サイト: 一般財団法人 統計質保証推進協会「統計検定」
この試験で身につく統計学は、データサイエンティストに求められる「データサイエンス力」の中のひとつです。
データサイエンティストを目指す方もより統計学の理解を深めたい方も活用されてみてはいかがでしょうか。
4. データサイエンティストに必要な3つのスキル
一般社団法人データサイエンティスト協会はデータサイエンティストに求められるスキルをまとめた「スキルチェックリスト」を公開しています。
参考資料:データサイエンティスト スキルチェックリスト ver3.00
データサイエンティストに求められる能力は、主に下記3つのスキルであるとされています。
- ビジネス力:課題背景を理解した上でビジネス課題を整理し解決する力
- データサイエンス力:情報処理、人口知能、統計学などの情報科学系の知恵を理解し使う力
- データエンジニアリング力:データサイエンスを意味のある形に使えるようにし、実装、運用する力
スキルチェックリストでは、上記に挙げた3つのスキルカテゴリごとに必要なスキルをチェック項目で確認できるようになっています。
また、スキルカテゴリごとのスキルレベルも測れますので、不足している知識や理解を深めるべきスキルを確認し、重点的に勉強するのもよいでしょう。
5. データサイエンティストの求人
データサイエンティストの求人では、分析基盤環境を整えたり、データ収集・分析ツールをプログラミングして作成することもあり、何らかのシステム開発経験やサーバー構築経験など、実務経験のある人材を求められることがほとんどです。
求人では、「データサイエンティスト」、または「データアナリスト」と呼ばれることもあります。「データマイニング」、「データ分析」などのキーワードで探してみることもおすすめです。
ITエンジニアからの転職を考えた場合、インフラエンジニアまたはSEやプログラマーでプログラミングやSQLの実務経験者、サーバー構築、またはそれに準ずるスキルがあることが望ましいと言えます。 また、Web担当者からの転職であれば、サイトのアクセス解析スキルのほか、コンバージョンに結び付けるための課題解決、企画提案スキルなどが役立ちます。
Proengineerの最新データサイエンティスト(アナリスト)求人はこちら
6. データサイエンス分野を学習するための講座
データサイエンスを学習できる講座をいくつか紹介します。
6.1 データサイエンティスト協会の「データサイエンティスト養成講座」
一般社団法人データサイエンティスト協会が実施するデータサイエンティスト養成講座は、1回あたり4か月にわたってデータサイエンス力を養う講座です。2017年には5月~8月、9月~12月の2回、2018年は9月~12月に開催されました。
2020年の開催についてはまだアナウンスがないようですが、毎回多くの応募があるということなので、興味のある方はぜひチェックしてみてください。
6.2 gaccoのデータサイエンス分野のオンライン講座
JMOOC(一般社団法人日本オープンオンライン教育推進協議会)公認のgacco(ガッコ)は、無料で学べる様々なオンライン講座を提供しています。
大学教授による講義がオンラインで受講できるサービスで、データサイエンス分野の講義には、統計学、社会人のためのデータサイエンス、大学生のためのデータサイエンス、高校生のためのデータサイエンス入門などがあります。
データ分析の基本的な部分から実務で使われる実践的な分析手法までを学ぶことができます。
また、データサイエンス分野以外にもクラウド基礎構築演習やIoTとシステムズアプローチなど、ITエンジニアのスキルアップとしても有効な講義が開講されています。
公式サイトをチェックして興味のある講座は積極的に受講してみることをおすすめします。
参考URL:gacco
6.3 Udemyのデータサイエンス関連講座
オンライン学習サイトのUdemyでは、入門者から上級者までを対象とした様々なデータサイエンス関連の講座を提供しています。
下記に人気講座の一例を紹介します。
◆【データサイエンティスト育成講座】Python初心者も歓迎!機械学習を駆使してビジネス課題を解決するためのエッセンス
ビジネスで機械学習を活用したい方やAIを自分で作りたい方向けに、ビジネスの現場で即戦力になるデータエンジニアリング力をつけるための内容が盛り込まれています。
◆【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門
データサイエンスをこれから勉強する方や初心者向けにデータサイエンスの一連の流れを解説しています。
参考URL:Udemy
7. まとめ
様々なスキルが必要とされるデータサイエンティスト。
これからのデータサイエンティストには、特に「データにビジネス的な価値」を見出すスキルがますます求められるでしょう。
実践的な実務経験を積むことはもちろん大切ですが、自分で積極的に知識・スキルを身につける努力も必要になってきます。
本記事で紹介したような資格を活用して、スキルアップ・キャリアアップに役立ててみてはいかがでしょうか。