本記事は実際に現場でデータ分析PJを推進している及び推進したい関連部門の方向けです。
ここ数年の間、業界/業種問わず、データ分析チームや専門部署の設立/ビッグデータ解析基盤の導入/分析人材の獲得などが行われ、実際に企業のビジネスにデータ分析を活かした事例も増えてきました。
一方で、一見するとうまくワークしているように見える現場/PJにおいて、人材のだぶつきや買っただけの分析ツール、他部門とのカニバリズムなどを感じられた方もいるのではないでしょうか?これは投資過多の時期では見逃されているマネジメントの落とし穴ではないでしょうか。特にデータチームがコストセンターとして配置されている企業では、結果に対しての監視が甘くなり、よりその傾向が強いように思えます。
そこで本記事では、「データ分析」の価値を定義し、分析プロジェクトが生み出す価値をもってプロジェクトを評価し推進する方法をご紹介します。
データ分析から生み出される価値とは何か?
世の中の様々な仕事は必ず付加価値を生み出しています。データサイエンティストとて例外ではありません。しかし複雑なバリューチェーンを持つ現代の産業において、それを定量的に評価するのは容易ではありません。
ここで自動車メーカーを例として考えます。彼らは数万点に及ぶ部品を仕入れ(原価相当)加工、組み立てをへて製品を作成します。加えて企画設計マーケティングを行い、最終消費者に販売します。この売上から原価を引いたものが彼らが生んだ付加価値となります。これは買い手のできないことを代替したことで生み出された価値と考えられます。買いては原材料があっても設計、組み立て加工ができない、もしくはできたとしてもQCDの保証ができないのです。我々が業務用スーパーにいって素材を買ってきてラーメンを作っても人気ラーメン店の味はQCDの意味で再現できないことと同様です。一方である法人がこの自動車を購入しても買い手の売上増加やコスト削減を保証はしません。
ではデータサイエンティストが生み出す付加価値は何でしょうか?原材料はデータと考えると、上記と同じように成果物は買手の企業に対しての「知」(形はデータ分析報告書であったり、モデル定義書であったり)と考えられるでしょう。データ分析を自前でやるよりQCDの意味ではるか上質な結果を買手が買ったということです。しかしここでデータサイエンティストというダイレクトに数値を扱う職業だからこそ別の方法で付加価値が定義できるのではないかと考えました。
ウイタ部分=利益貢献部分
データ分析の結果得られた施策より、コスト(例えば販売管理費)が10%削減されたとしましょう。この時販売管理費の10%「ウイタ」部分がデータ分析によって生み出された価値と定義すると、自然ではないでしょうか。
(筆者作成)
例) DM一通の期待収益は:=LTV×反応率-DM発想コストとすると反応率の改善が期待収益の増加に寄与することがわかる。仮にLTVが5万、DM発想コスト400円/一通、反応率が1%とすると期待収益は100円である。今データ分析により得られた示唆により、DMの反応率が2%改善されたとすると期待収益/一通は600円となる。このウイタ600円が部分の一部をデータサイエンティストに起因する付加価値と考えるということです。(もちろん1万通発想すれば600万円です)
生み出される価値を起点としたプロジェクト計画
一方でデータ分析プロジェクトの多くは、データがあるから何かもっともらしい分析をおこなうというような、手段と目的が逆転しているものを良く見かけます。本記事ではそうではなく、データ分析により創造される価値を基準に分析プロジェクトを設計することを考えます。
前項で利益貢献のウイタ部分がデータ分析の価値であると定義しました。従って利益貢献の大きい施策に繋がる分析をおこなうべきではないでしょうか?どのようにそのような分析プロジェクトを設計すればよいのでしょうか?
利益を構造化し、プロジェクトの目指す仮説を作成する
利益をコントロールする変数は、売上と費用です。更に売上をコントロールする変数は顧客単価/顧客数、顧客数は、新規顧客数、既存顧客数….と利益をコントロールする変数を分解していくことができます。
この分解の結果「改善の余地があるkpiを探し、「分析により__を__して__を__%改善できるのではないか」という仮説を立案する→それを検証するのがプロジェクトの短期的な目標となります。
(筆者作成)
筋の良い仮説=(分析による価値(ウイタ部分)ー分析労力)が最も大きい仮説
筋のよい仮説は以下2つの引き算の結果が大きいものと定義できます。
分析による価値
仮説からあるkpiをx%上昇させることができると見積もると、利益貢献部分を計算することができる。
さきほどの例にもどろうある商品のDM一通の期待収益は
「期待収益=LTV×反応率−DM発送コスト」
期待収益は反応率の関数であるため、データ分析の結果からこれを予測することができる。
分析労力
データ収集/加工/分析/可視化/レポーティング/実装(展開)等の工程ごとに見積もり(工数+固定費)、その和として表現します。例えばこのDMの例で言えば分析データは自前のため収集/加工は労力が少ないです。一方で反応率をあげるためのモデルを作成するには大きな労力がかかります。
*(コストを正確に見積もることは難しいが、見積もる過程が、プロジェクトのリスクを洗い出す作業にもなるので重要です
分析標準フレームワークを用いると工程ごとの労力(コスト)を見積もるのが楽になる。またコストに応じた価値を分配することにより、バリューチェーンの可視化が可能となります。
(筆者作成)
付加価値 driven な考えがなぜ重要か
これまで、データ分析が生み出す付加価値及び付加価値をベースとした分析PJの設計について述べてきました。ここでは付加価値ベースとそうでない場合如何に違いがあるかまとめました。
(筆者作成)
如何でしたでしょうか。データサイエンティストの評価に関しては未だこ難しい機械学習などの技術偏重があると私見ています。しかし本当に評価されるべきなのは付加価値を生み出すデータサイエンティストではないでしょうか?本ブログのテーマであるプロのデータサイエンティストは後者であると考えています。是非本記事を通してプロが増える事を期待しています。