【必要なスキル多すぎじゃない!?】データサイエンティストに必要なスキル

approach

データサイエンティストを目指そうと思い立ったものの、「必要なスキル多すぎじゃない!?」とびっくりする方も多いのではないでしょうか。

それもそのはず、データサイエンティスト協会が定義しているスキル項目は全572項目も存在するからです。しかし、実際にはすべての項目を習得する必要はありません

筆者は現役のデータサイエンティストですが、見ず知らずのスキルも多いです。それでも、データサイエンス業界で十分活躍できていると自負しています。

この記事ではデータサイエンティストが必要なスキルを具体的に解説していきます。

この記事を読むと、データサイエンティストとして真に身に付けるべきスキルがわかります

では、本題に移ります。

データサイエンティスト協会が定義するスキル項目は全572項目

データサイエンティスト協会のスキルチェックリストによるとデータサイエンティストに必要なスキル項目は572項目もあります。

「スキルカテゴリ」をピックアップしても下記のように、ものすごい項目数が列挙されています。

データサイエンティスト協会 スキルチェックリスト_ver4.00より抜粋

ここで重要な点は「ビジネス力」「サイエンス力」「エンジニアリング力」の3つの「力」が定義されている点です。

データサイエンティストは3つの役割に大別される

データサイエンティストは「ビジネス型」「サイエンス型」「エンジニアリング型」の3つの役割に大別されます

データサイエンティストが実施した調査結果の中でも各企業が必要としているデータサイエンティストの役割は様々であることがわかります。

データサイエンティスト協会 「データサイエンティストの採用に関するアンケート調査結果(2019年度)」
  • タイプ①「ビジネス型」:ビジネス課題を抽出し、データを分析・活用して課題を解決できる人材
  • タイプ➁「サイエンス型」:統計学、人工知能などの情報科学系の知識を理解し、統計ソフトなどを用いた専門的な分析ができる人材
  • タイプ➂「エンジニアリング型」:データ分析を目的とし、プログラミング知識を使ってデータの収集、加工やシステムへの実装、運用ができる人材

市場に求められているデータサイエンティストは様々で、各役割がまんべんなく求められています。

これは、データの活用方法によって各企業が必要とする専門性が変わるからです。
ゆえに、各役割に求められるスキルも変わります

「ビジネス型」にはビジネスを動かすスキルが必要

「ビジネス型」のデータサイエンティストは「ビジネス課題を抽出し、データを分析・活用して課題を解決できる人材」です。

「ビジネス型」にはビジネスを動かすスキルが必要です。
これは、下記の3つに集約できます。

  • 課題を設定して解決アプローチを具体化する力
  • 分析組織をマネジメントする力
  • ビジネスを推進する力

データサイエンティスト協会が定めるスキルとのマッピングは下記のようになります。

「ビジネス型」に必要なスキル

詳細に解説していきます。

課題を設定して解決アプローチを具体化する力

「ビジネス上の課題を明確化した上で、データ分析により効果的な課題解決アプローチを具体化する力」です。

ビジネスは複雑性が高く困難な状況が多いです。
複雑な状況の中で本質的な課題なにか?ということを見極めて明確化することが重要です。

「ビジネス型」のデータサイエンティストは解決すべき課題を明確化する力が求められます。

同時に、解決すべき課題に対して、どのように解決するか?を検討することが大切になります。
その解決策を見出すために、データ分析を活用しながら効果的なアプローチを具体化する力が求められます。

分析組織をマネジメントする力

「ビジネス上のスケジュールや人員を管理しながら実施すべき分析を見極めて分析を実行する力」が求められます。

ビジネスの現場では期限や人員が限られています。
さらに、システム負荷などの様々な要因も考量して分析を進める必要があります。

このような状況の中で、解くべき課題に対して、いつまでになにを明らかにすべきかを優先度を付けてスケジューリングすることが重要です。

さらに、日々刻刻と移り変わるビジネス環境の中では、分析の優先度が時がたつごとに変化します。

そのため、常にビジネスの状況を把握して分析の優先度を変えつつ、分析組織を動かすマネジメント能力が求められます。

ビジネスを推進する力

「分析結果から見出した課題解決アプローチを意思決定者に伝えてビジネスを推進する力」が求められます。

高度な分析手法を使って得られた分析結果や示唆はデータサイエンティスト目線では理解できますが、分析の専門家ではないビジネスマンは理解できません。

どのような分析結果であっても理解されなければ価値は低く、無駄になってしまいます

そのため、得られた分析結果をいかにわかりやすく伝えるかが重要です。
分析結果をわかりやすく伝えることで、結果的にビジネス全体を動かすことができます。

分析の結果、明らかになったこと・次に何をしていくべきかをわかりやすく意思決定者に伝えてをビジネスを推進していく力が必要です。

「サイエンス型」はデータから有用な示唆を得る力が必要

「サイエンス型」は「統計学、人工知能などの情報科学系の知識を理解し、統計ソフトなどを用いた専門的な分析ができる人材」です。

「サイエンス型」に必要なスキルは下記の4つに集約できます。

  • 課題を深く理解・構造化する力
  • 最適な分析アプローチを具体化する力
  • 分析結果を解釈して意味づける力
  • 専門スキル(必要に応じて)

「サイエンス型」では汎用的なスキルではないが、特定の領域で必要とされる「専門スキル」が必要とされる場合があります

データサイエンティスト協会が定めるスキルとのマッピングは下記のようになります。

「サイエンス型」に必要なスキル

課題を深く理解・構造化する力

「ビジネス上の課題を深く理解して構造的に整理することで解くべき命題を定める力」が求められます。

サイエンス力に強みを持つ「サイエンス型」ですが、ビジネス課題を深く理解することが重要です。
大前提のビジネス理解がないと、分析の目的を明確化することは難しく、誤った分析アプローチを選択してしまうリスクが高まります。

誤った分析アプローチを選択しないように、ビジネス課題を深く理解して、課題をシンプルな構造に整理します。

そして、解くべき命題まで落とし込むことでなぜその分析をするのか?を明確にします。
このプロセスを挟むことで目的に合致した分析を行うことができます

まず分析目的を正確に設定するため、ビジネス課題を深く理解して、解くべき命題を定める力が求められます。

最適な分析アプローチを具体化する力

「幅広い統計知識・機械学習の知識と解くべき命題を照らし合わせて最適な分析アプローチ具体化する力」

サイエンス型のデータサイエンティストは解くべき命題に対して、多角的な分析アプローチを検討します。
統計的な知識・数学的な理解・機械学習の知識を最大限活用して、分析の要件に合致した最適な分析方法を選択して分析を実施します。
分析方法を検討する観点は様々あり、解くべき命題の特性・取得可能なデータ量・スケジュール・人的工数など多くの観点を考慮した上で、最適な分析アプローチを具体化します。

サイエンス型のデータサイエンティストとして、自らの知識やスキルが最も色濃く発揮できるフェーズであり、分析アプローチの引き出しの多さ・深さが求められます。

サイエンス型のデータサイエンティストには最適な分析アプローチを具体化する力が強く求められ、この力を身に付けていくために日々の学習・トレンドの把握を行う必要があるため、日々の学習や情報収集が重要となります。

分析結果を解釈して意味づける力

「分析結果とビジネス背景を紐づけてビジネス観点で有用な示唆を導出する力」

サイエンス型のデータサイエンティストには上記で述べた通り、専門的な知識を用いた分析を実施します。
分析アプローチによっては複雑性が高く、高度な解釈が求められることが多々あります。その際、利用したデータの特性などを確認しながら、解釈を深めていく必要があります。
さらに、解釈した結果を基にビジネス観点で再度分析結果を眺めて、ビジネス観点で有用な示唆を導出する必要があります。
最終的な分析の目的はビジネス上の意思決定、Nextアクションを決めることにあります。

そのため、高度な分析を行うサイエンス型のデータサイエンティストの最終の成果物として、ビジネス観点での有用な示唆が求められます。

専門スキル

「汎用的に必要なスキルではないが特定領域では必須となる専門スキル」

ここでは自然言語処理/画像・映像認識/音声認識を専門スキルとして位置づけております。
これらのスキルは特定の領域においては非常に重要になるのですが、一般的なデータサイエンティストにとってはやや利用するシーンが限定的です。
画像認識や音声認識を専門的に扱う職種はデータサイエンティストというよりは、機械学習エンジニアと呼称されることが多く、やや専門的な立場であり、汎用的なデータサイエンティストとは少し毛色がやや異なります。
そのため、サイエンス型のデータサイエンティストに対して必須スキルではないと位置付けています。

「エンジニアリング型」はデータ管理を最適に実施する力が必要

「エンジニアリング型」に必要なスキルは下記の3つに集約できます。

  • データ管理の課題を明確化する力
  • 最適なシステム設計を具体化する力
  • 持続可能な仕組みを構築する力

データサイエンティスト協会が定めるスキルとのマッピングは下記のようになります。

「エンジニアリング型」に必要なスキル

データ管理の課題を明確化する力

「データ分析者の業務を深く理解した上でデータ管理に関する課題を明確化する力」

エンジニアリング型のデータサイエンティストはデータ管理を適切に実施して、分析組織全体の分析品質・効率を向上させることが求められます。

そのため、データ分析者の業務を深く理解する必要があり、分析組織全体を広く見た際の課題を的確に設定する力が求められます。

分析組織が大きくなればなるほど、あらゆるチームでデータが作成され始めます。
同じようなデータ項目を作っていても、実際は微妙にデータの定義が異なり、違った数値で分析が進められてしまう、などといったデータ管理上の課題が発生することも多いです。

そのような大きな組織で分析を実施していくことで、データ管理上の課題が多く発生します。
そのため、データ管理をする上で解決すべき課題を明確にする力が求められます。

最適なシステム設計を具体化する力

「環境知識や最新の技術を活用してデータ分析の効率を最大化するシステム設計を具体化する力」

分析の効率を最大化させるためには、システムを最適に設計する必要があります。

上記で明確化した課題を解決するために、どのようなシステム設計にするべきか?どのような技術を用いるべきか?を検討していく必要があります。
その際にインフラ・環境周りの知識や最新の技術の理解が必要とされます。

そのため、エンジニアリング型のデータサイエンティストも日々情報をアップデートして、最新の技術に敏感であり続けなければいけません。

実際にシステム設計する際には、データ分析者の業務・既存環境の制約・セキュリティポリシー・予算など様々な観点を考慮しなければなりません。
さらに、システムの変更は頻繁に実施できるものではないため、緻密で慎重な設計が求められます。

持続可能な仕組みを構築する力

「業務プロセスや運用プロセスを整備してデータ分析を効率的に高品質に実行する仕組みを構築する力」

分析組織全体の分析品質・効率を上げることは一過性のものであってはいけません。そのため、いかに持続可能な形で仕組みを構築するかという観点が重要になります。

システムの運用はもちろん対象になりますが、時には実際にデータ分析を行っているデータサイエンティストで実施すべき事項も多くあります。

例えば、チーム横断のバーチャル組織を組成し、個別に作成しているデータの定義をドキュメント化してもらう、異なるデータ定義を使わないように定期的にコミュニケーションを取れる仕組みを作るなど、組織上起きうる課題に対して、業務プロセスでカバーすることも検討しなければなりません。


データ管理を適切に行うために、システムでカバーできる範囲・業務プロセスでカバーする範囲を見極めて分析組織全体の品質・効率を向上する仕組みを構築する力が求められます。

データサイエンティストのスキルアップ

上記のようにデータサイエンティストに必要な力を解説しましたが、実際にどのようにスキルアップしていけばよいのかをここでは説明していきます。

ビジネス型のスキルアップ
サイエンス型のスキルアップ
エンジニアリング型のスキルアップ

上記のようにデータサイエンティストに必要な力を解説しましたが、実際にどのようにスキルアップしていけばよいのかをここでは説明していきます。

データサイエンティストは「ビジネス型」「サイエンス型」「エンジニアリング型」の3つに大別することができると述べてきました。
しかし、初めに経験すべき領域はすべて同じであります。まずはサイエンス力の領域からスキルを付けていくことが望ましいでしょう。なぜなら、前述したようにどの型であっても、根底にはデータ分析に対して深い理解が求められるからです。
まずは実際のデータ分析業務を経験して、データサイエンス力を一定の水準で身に付けて自力を固めることが重要になります。

そこから目指すべき型によってスキルの幅を広げていき、少しづつ重心を寄せていくスキルアップが理想的でしょう。

コメント

タイトルとURLをコピーしました