データサイエンティストに必要なスキルは?

approach

データサイエンティストに必要なスキルは?

本記事ではデータサイエンティストになるために必要なスキルについて記載していきます。
データサイエンティストは様々な「型」があり、それぞれの「型」によって活躍するレイヤー・業務内容も異なっていることをデータサイエンティストの業務内容は?で記載しました。

実際に各業務を遂行していく上で、必要となるスキル・能力について解説していきます。

データサイエンティスト協会が定義するスキル定義

データサイエンティスト協会ではデータサイエンティストに必要とされるスキルを次のように定めています。
詳細に定義されているため、ここでは「スキルカテゴリ」で定義されている大区分を参照して記載しています。

https://www.datascientist.or.jp/common/docs/skillcheck_ver4.00_simple.xlsx

非常に網羅的に記載されており、整理されているスキル定義になっております。
これらの詳細の中身を見ていくことはかなり骨の折れる作業になりますので、筆者のデータサイエンス現場の経験を基にこれらの要素の過不足を補填しながら各能力を3つの力にまとめてよりシンプルに記載していこうと思います。

データサイエンティストに必要なスキル

ここではデータサイエンティストの業務内容は?で記載した「ビジネス型」「サイエンス型」「エンジニアリング型」別に必要なスキルを3要素に集約して記載していきます。
前述したようにデータサイエンティストに求められるスキル能力は幅広く多様的であることが前提です。その中でも特に必要とされるスキルについて3つのスキルに集約して記載していきます。

「ビジネス型」に必要なスキル

「ビジネス型」に必要なスキルは下記の3つに集約できます。

  • 課題を設定して解決アプローチを具体化する力
  • 分析組織をマネジメントする力
  • ビジネスを推進する力

データサイエンティスト協会が定めるスキルとのマッピングは下記のようになります。

「ビジネス型」に必要なスキル
課題を設定して解決アプローチを具体化する力

「ビジネス上の課題を明確化した上で、データ分析により効果的な課題解決アプローチを具体化する力」

ビジネスの現場では複雑性が高い状況が多いです。その中で何が課題なのかを見極めて明確化することが重要です。
課題がどこにあって、その課題を解決することで何がもたらされるのか、を正確に見極めることがビジネスでの意思決定の質を左右します。
そのため、「ビジネス型」のデータサイエンティストにとって、解くべき課題を明確化することは最も重要な要素と言えます。

同時にその課題に対して、どのように解決を図るかを検討することが必要です。
複雑性が高い事象に対して、データ分析を通じて課題の理解を深めていきながら、効果的な課題解決アプローチを具体化していく力が求められます。

分析組織をマネジメントする力

「ビジネス上のスケジュールや人員を管理しながら実施すべき分析を見極めて分析を実行する力」

ビジネスの現場では期限や人員が限られている状況しかありません。
期限と人員の状況だけでなく、データの整備状況やシステム負荷などの様々な要因も併せて考量する必要があります。
このような状況の中で、解くべき課題に対して、いつまでになにを明らかにすべきかを優先度を付けてスケジューリングすることが求められます。
さらに、日々刻刻と移り変わるビジネス環境の中では当初決めたスケジュール通りに進められることは多くなく、分析で明らかにすべき問いが優先度が時が経つごとに変化します。
そのため、常に分析の状況を把握し、実施すべき分析の優先度を変えながら、分析結果を創出する力を求められます。

ビジネスを推進する力

「分析結果から見出した課題解決アプローチを意思決定者に伝えてビジネスを推進する力」

あらゆる分析手法を駆使して導出された事実や示唆はデータサイエンティスト目線では理解できるものの、分析の専門家ではないビジネスマンが必ずしも理解できるとは限りません。どんな分析結果であっても最終的に意思決定に使われなければ価値は低く、人員の無駄遣いになってしまいます。
そのため、導出された分析結果を如何に意思決定者にわかりやすく伝えて、ビジネス全体を動かすことが重要になります。
分析の結果、何が明らかになり、それが故に何をしていくべきかを明確にして意思決定者に伝えてをビジネスを推進していく力が求められます。

「サイエンス型」に必要なスキル

「サイエンス型」に必要なスキルは下記の3つに集約できます。
また、「サイエンス型」では汎用的なスキルではないが、特定の領域で必要とされる「専門スキル」が必要とされる場合があります。こちらを切り出して記載しています。

  • 課題を深く理解・構造化する力
  • 最適な分析アプローチを具体化する力
  • 分析結果を解釈して意味づける力
  • (専門スキル)

データサイエンティスト協会が定めるスキルとのマッピングは下記のようになります。

「サイエンス型」に必要なスキル
課題を深く理解・構造化する力

「ビジネス上の課題を深く理解して構造的に整理することで解くべき命題を定める力」

サイエンス力に強みを持つ「サイエンス型」ですが、ビジネス上の課題を深く理解することが重要です。
大前提のビジネス理解がないと、分析の目的を明確化することは難しく、誤った分析アプローチを選択してしまうリスクが高まります。
このリスクを回避するために、ビジネス上の課題を深く理解して、その課題をより詳細に構造的に整理します。
そして、解くべき命題までブレイクダウンしてなぜその分析をするのか、解くべき命題はなにかを明確にします。このプロセスを挟むことで目的に合致した分析を実現することができます。

まず分析の目的を正確に合わせるために、解くべき命題を定める力が求められます。

最適な分析アプローチを具体化する力

「幅広い統計知識・機械学習の知識と解くべき命題を照らし合わせて最適な分析アプローチ具体化する力」

サイエンス型のデータサイエンティストは解くべき命題に対して、多角的な分析アプローチを検討します。
統計的な知識・数学的な理解・機械学習の知識を最大限活用して、分析の要件に合致した最適な分析方法を選択して分析を実施します。
分析方法を検討する観点は様々あり、解くべき命題の特性・取得可能なデータ量・スケジュール・人的工数など多くの観点を考慮した上で、最適な分析アプローチを具体化します。
サイエンス型のデータサイエンティストとして、自らの知識やスキルが最も色濃く発揮できるフェーズであり、分析アプローチの引き出しの多さ・深さが求められます。

サイエンス型のデータサイエンティストには最適な分析アプローチを具体化する力が強く求められ、この力を身に付けていくために日々の学習・トレンドの把握を行う必要があるため、日々の学習や情報収集が重要となります。

分析結果を解釈して意味づける力

「分析結果とビジネス背景を紐づけてビジネス観点で有用な示唆を導出する力」

サイエンス型のデータサイエンティストには上記で述べた通り、専門的な知識を用いた分析を実施します。
分析アプローチによっては複雑性が高く、高度な解釈が求められることが多々あります。その際、利用したデータの特性などを確認しながら、解釈を深めていく必要があります。
さらに、解釈した結果を基にビジネス観点で再度分析結果を眺めて、ビジネス観点で有用な示唆を導出する必要があります。
最終的な分析の目的はビジネス上の意思決定、Nextアクションを決めることにあります。

そのため、高度な分析を行うサイエンス型のデータサイエンティストの最終の成果物として、ビジネス観点での有用な示唆が求められます。

専門スキル

「汎用的に必要なスキルではないが特定領域では必須となる専門スキル」

ここでは自然言語処理/画像・映像認識/音声認識を専門スキルとして位置づけております。
これらのスキルは特定の領域においては非常に重要になるのですが、一般的なデータサイエンティストにとってはやや利用するシーンが限定的です。
画像認識や音声認識を専門的に扱う職種はデータサイエンティストというよりは、機械学習エンジニアと呼称されることが多く、やや専門的な立場であり、汎用的なデータサイエンティストとは少し毛色がやや異なります。
そのため、サイエンス型のデータサイエンティストに対して必須スキルではないと位置付けています。

「エンジニアリング型」に必要なスキル

「エンジニアリング型」に必要なスキルは下記の3つに集約できます。

  • データ管理の課題を明確化する力
  • 最適なシステム設計を具体化する力
  • 持続可能な仕組みを構築する力

データサイエンティスト協会が定めるスキルとのマッピングは下記のようになります。

「エンジニアリング型」に必要なスキル
データ管理の課題を明確化する力

「データ分析者の業務を深く理解した上でデータ管理に関する課題を明確化する力」

エンジニアリング型のデータサイエンティストはデータ管理を適切に実施して、分析組織全体の分析品質・効率を向上させることが求められます。
そのため、データ分析者の業務を深く理解する必要があり、分析組織全体を広く見た際の課題を的確に設定する力が求められます。
分析組織が大きくなればなるほど、あらゆるチームでデータが作成され始めます。同じようなデータ項目を作っていても、実際は微妙にデータの定義が異なり、違った数値で分析が進められてしまう、などといったデータ管理上の課題が発生することも多いです。そのような大きな組織で分析を実施していくことで、データ管理上の課題が多く発生します。
そのため、データ管理をする上で解決すべき課題を明確にする力が求められます。

最適なシステム設計を具体化する力

「環境知識や最新の技術を活用してデータ分析の効率を最大化するシステム設計を具体化する力」

分析の効率を最大化させるためには、システムを最適に設計する必要があります。
上記で明確化した課題を解決するために、どのようなシステム設計にするべきか?どのような技術を用いるべきか?を検討していく必要があります。その際にインフラ・環境周りの知識や最新の技術の理解が必要とされます。そのため、エンジニアリング型のデータサイエンティストも日々情報をアップデートして、最新の技術に敏感であり続けなければいけません。
実際にシステム設計する際には、データ分析者の業務・既存環境の制約・セキュリティポリシー・予算など様々な観点を考慮しなければなりません。さらに、システムの変更は頻繁に実施できるものではないため、緻密で慎重な設計が求められます。

持続可能な仕組みを構築する力

「業務プロセスや運用プロセスを整備してデータ分析を効率的に高品質に実行する仕組みを構築する力」

分析組織全体の分析品質・効率を上げることは一過性のものであってはいけません。そのため、いかに持続可能な形で仕組みを構築するかという観点が重要になります。
システムの運用はもちろん対象になりますが、時には実際にデータ分析を行っているデータサイエンティストで実施すべき事項も多くあります。
例えば、チーム横断のバーチャル組織を組成し、個別に作成しているデータの定義をドキュメント化してもらう、異なるデータ定義を使わないように定期的にコミュニケーションを取れる仕組みを作るなど、組織上起きうる課題に対して、業務プロセスでカバーすることも検討しなければなりません。
データ管理を適切に行うために、システムでカバーできる範囲・業務プロセスでカバーする範囲を見極めて分析組織全体の品質・効率を向上する仕組みを構築する力が求められます。

データサイエンティストのスキルアップ

上記のようにデータサイエンティストに必要な力を解説しましたが、実際にどのようにスキルアップしていけばよいのかをここでは説明していきます。

ビジネス型のスキルアップ
サイエンス型のスキルアップ
エンジニアリング型のスキルアップ

上記のようにデータサイエンティストに必要な力を解説しましたが、実際にどのようにスキルアップしていけばよいのかをここでは説明していきます。

データサイエンティストは「ビジネス型」「サイエンス型」「エンジニアリング型」の3つに大別することができると述べてきました。
しかし、初めに経験すべき領域はすべて同じであります。まずはサイエンス力の領域からスキルを付けていくことが望ましいでしょう。なぜなら、前述したようにどの型であっても、根底にはデータ分析に対して深い理解が求められるからです。
まずは実際のデータ分析業務を経験して、データサイエンス力を一定の水準で身に付けて自力を固めることが重要になります。

そこから目指すべき型によってスキルの幅を広げていき、少しづつ重心を寄せていくスキルアップが理想的でしょう。

コメント

タイトルとURLをコピーしました