データサイエンティストの無駄遣いはやめよう

開発定義

こんにちは、ガロガロニーです。最近、データサイエンティストの需要が増えてきてるようですね。様々な企業が採用を行い、大学や専門学校などでもデータサイエンティストを育成する学科を設置しているそうです。確かにデータサイエンティストは、日本で確実に需要不足なのは間違いないのですが、雇ったは良いものの彼らのケーパビリティを活かせていないケースも多い気がします。本日はデータサイエンティストの無駄遣いについてお話したいと思います。

データサイエンティストの得意なこと

そもそもデータサイエンティストの役割とは何でしょうか?例えば、彼らの大きな役割の一つとして、大量のデータを分析し、ビジネスに活かせる何かしらの示唆を見つけ、データ活用の提案を行うなどがあります。社内で蓄積されている活用できていないデータをビジネスに繋げるのが彼らの役割です。そのために、様々なプログラミング言語やツールを活用して、データを可視化し、必要に応じて機械学習などの手法を使って、分析を行うことを得意とします。最終的に、データをどうビジネスに活用するか、提案することも業務の一つでしょう。つまり、データサイエンティストが得意なことは下記が挙げられます。

  • データを利用したビジネス戦略の提案
  • ビッグデータ解析・可視化
  • PythonやRなどのプログラミング
  • 機械学習などのAI技術を活かした分析

データサイエンティストの苦手なこと

逆にデータサイエンティストが苦手なことは何でしょうか?もちろん人にもよりますが、基本的に本格的なシステム化に向けたエンジニアリング作業は苦手な傾向にあります。彼らはエンジニアではなく、サイエンティストなので、実運用を意識したシステム設計やプログラム開発、テスティングなどは専門外になります。もちろん、運用保守についても同様です。また、SQLは使えても、データベースの論理設計や物理設計などは専門外な場合が多いです。さらにクラウドを中心としたシステム基盤周りについても、本格的なデータパイプラインの構築やコンテナベースでのシステム構築などは慣れていない傾向にあります。以上をまとめると、データサイエンティストが苦手なことは下記が挙げられます。

  • ソフトウェアエンジニアリング作業
  • システム運用保守
  • データベースの設計
  • クラウドシステム基盤の構築

無駄遣いとは何か

上述でまとめた通り、データサイエンティストには得意な領域と苦手な領域があります。基本的に彼らが得意とするデータ分析作業に注力してもらえれば、仕事の効率も上がり、成果も上がりますので何の問題もありません。一方で、多くの企業はデータサイエンティストに対して、苦手なことを任せてしまっているケースが多々あり、これがデータサイエンティストの無駄遣いとなっているわけです。

機械学習プロジェクトの例

例えば、機械学習プロジェクトを進める上では、モデル開発(PoC)、システム化、運用保守の3つのフェーズがあるのが一般的です。モデル開発自体はデータサイエンティストが得意とする領域なので、積極的に参画いただくのは良いと思います。一方で、システム化以降のフェーズでは、ソフトエンジニアリング作業やシステムアーキの検討、継続的なシステム運用保守など、データサイエンティストが苦手な領域が多くなります。これらの領域はデータ・AIエンジニアに任せるべきなのですが、データサイエンティストが担当している場合があり、ケーパビリティを活かしきれていないことがあります。データサイエンティスト方は優秀な方が多く、苦手な領域もカバーできてしまうので、これらのタスクを何となくこなしてしまうのですが、非常にもったいないと感じています。

データサイエンティストの能力を最大限に活かす

データサイエンティストは、苦手なシステム開発やデータ設計などは、エンジニア達に任せるべきであり、データ分析作業に専念するべきだと考えています。データサイエンティストは、特に単価の高い職種になるので、せっかく採用したのに苦手な分野をしてもらっても、もったいないだけです。データサイエンティストの能力を最大限活かせる領域を知り、組織体制を整えることが大切です。特にシステム化などの案件が中心となる場合は、データ・AIエンジニアを多く採用する方が効率が良くなることが多いので、体制のバランスを考えるようにしましょう。

まとめ

今回は「データサイエンティストの無駄遣いはやめよう」というタイトルで、紹介させていただきました。適材適所という言葉もありますが、データサイエンティストのケーパビリティをうまく活かせるような体制を作っていきたいですね。それでは、また!

コメント

タイトルとURLをコピーしました