株式会社Crosstab 代表取締役 漆畑充
Society 5.0
Society 5.0とは第5期科学技術基本計画の中で提唱された概念で、
“サイバー空間とフィジカル空間(現実社会)が⾼度に融合した「超スマート社会」を未来の姿として共有し、その実現に向けた⼀連の取組”
内閣府資料 1https://www8.cao.go.jp/cstp/kihonkeikaku/5gaiyo.pdf
とされています。具体的な例として交通データを用いたモビリティサービスの高度化、医療データを活用した個人の健康促進や予防医療への応用などです。その他にも食品や農業など様々な分野での取組が期待されています。特にこれまでの情報化社会(Society 4.0)との違いとしてサイバー空間とフィジカル空間がシームレスに結合され、AIやデータ活用を元に新たな価値を創造するという点が強調されています。
本コンセプトの初出は2016年ですが、間違いなくポストコロナの時代のDXの一つの道標となることが予想されます。従って当然データサイエンスの立場からもこれらの動きを無視する事はできません。そこで本稿では今までのデータサイエンスのあり方を振り返り、現状の問題点と、そしてSociety 5.0を意識した今後のあるべき姿について弊社の見解を述べて行きたいと思います。
2010年代 ビジネスにおけるデータサイエンスの萌芽
2010年代前半頃よりwebサービス企業を中心にビッグデータを呼び水としてデータサイエンスブームが起こりました3データ・サイエンティストに学ぶ「分析力」 ビッグデータからビジネス・チャンスをつかむ ディミトリ マークス (著), ポール ブラウン (著), 馬渕 邦美 (監修) は日本にデータ・サイエンティストという言葉を広く知らしめた書籍であり、2013年3月4日に発売されている。4「Data Scientist: The Sexiest Job of the 21st Century」Harvard Business Review https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century データサイエンティストを21世紀、最もセクシーな職業と評した有名なこの記事は2012年10月に公開された。。企業が自社のデータを蓄積し、データサイエンティストと呼ばれる専門人材を用いてそれらを分析させ自社の事業に活用するという取組が当たり前のように行われるような時代になったのです。これより前から金融機関や事業会社のマーケティング部門などでも似たような取組は行われていましたが、あくまでリスク管理やCRMといったある部門・機能に限定的な動きであり、扱うデータも少量でした。対してこの流行下でのデータ関連プロジェクトの特徴はCXOからのトップダウン方式である、webログをはじめとして非常に大きいデータを扱うなど、様々な意味で従来のものとは規模もスケールも異なるものでした。
このブームの初期、各企業は人材採用とデータストレージへの投資に注力しました。データサイエンティスト自体が新しい職種であったため、経験者は無論のこと適正者も希少という状態でしたので、人材市場での候補者の価値は高くなりがちでした。現在でも続くデータサイエンティストが高給という印象はこの時代の人材事情が影響していると思われます。
この頃のストーレジはクラウドではなくオンプレミスのカラム指向型(従来のRDBは行指向型)が主流でした。ほぼ同時期にhadoopディストリビュータが表れこちらはwebログのトランザクションのようなデータの保管として使われるようになります。
それらから程なくしてデータサイエンティストとは異なる機械学習エンジニアという職種が台頭してきます。前者はコンサルティングやビジネススキルに強みを持ち、後者は実装力を含めた従来のITエンジニアに近いスキルを持っているとされています。同時に機械学習やデータサイエンスに係る技術の高度化が進みます。kaggleと言われる分析コンペティションのプラットフォームがそれに拍車をかけました。また機械学習の領域では深層学習におけるブレイクスルーが置き、第4次AIブームが到来しました。2010年代中盤にはクラウドストレージが主役となり、企業は高額な初期費用や保守費用の負担をすることなく、従量課金でサービスを利用できるようになりました。
ビジネスにおけるデータサイエンスの黎明期は人材とそれを実現する技術の高度化に焦点が当てられたと言えます。
次の時代への課題
データやAIの活用に積極的でありかつ、成功している企業の代表例はGAFAやNetflixのようなデジタルプラットフォーマーであることに異論はないはずです。彼らは(Appleを除けば)生まれながらのデータドリブン企業と言えます。何故ならば創業時より自社でデータを収集し、それらを活用したサービスを提供しているから、もう少し具体的に言えばバリューチェーンの中にデータ収集→加工→AI・機械学習モデル構築→付加価値創造→サービスに還元というデータチェーン5データサプライチェーンとも言うようです。https://hbr.org/2021/06/data-management-is-a-supply-chain-problemが元より組み込まれているからです。またここ10年ぐらいの間に創業したIT系スタートアップの多くも始めからデータを収集、活用する出口戦略ありきでプロダクトを開発しており、これらも生まれながらのデータドリブン企業と言えます。このような企業はデータやAIの活用成果と事業存続に強い相関があるという特徴を持ちます。
一方で我が国の伝統的な企業はどうでしょうか?以下の図表1を見てみますと、およそ約4割はデータの利活用ができていない、また全体の約2/3はそのビジネスへの成果を得ていないと回答しています。加えてこの調査対象者はITユーザ企業とのことですので、一般のレガシーな企業を対象とした場合もっと悲観的な結果になった可能性もあります。前述したITメガベンチャーと異なり、彼らのビジネスモデルはそもそもバリューチェーンの中にデータチェーンを要するものではありません。そのためデータやAIの活用が遅れたり、その活用成果が得られていなくても急に業績が悪くなったりすることはありません(ゆでガエルになる可能性があります)。ある意味既存バリューチェーンが頑健であるため、あえてデータやAIの活用をしなくとも短期的には困らないという状況が活用を遅らせ、またその頑健さゆえデータバリューチェーンの入り込む要素がないため、R&Dや経営企画内の取組に終始してしまいデータ活用が表面的になりその成果が得られていないのではないかという懸念があります。例えばBIツールを導入し売上を可視化する仕組みを作ったとしても、それを見て情報を得て付加価値を創造するという工程が業務プロセスに無ければそれは無用の長物です。一時期多くの企業の受付にペッパー君が置かれていた時期がありましたが、一時的な珍しさで注目されただけで次々と姿を消したのと同じです。
[図表1]
出典:ガートナー (ITデマンド・リサーチ)/調査:2018年11月6ガートナージャパン株式会社プレスリリース https://www.gartner.co.jp/ja/newsroom/press-releases/pr-20190527
ビジネスにおけるデータサイエンスの黎明期は、データサイエンティストや機械学習エンジニアのような人材とクラウドや深層学習のようなテクノロジー、つまり「どのように実行するか」という観点に重きを置かれてきました。しかし前述したように我が国の多くの企業がその成果について十分な説明ができているかというと疑問です。筆者はこれをポストコロナの時代への課題と捉え、データチェーンとバリューチェーンの巧みな連続的かつ持続的な連携から付加価値を創造する仕組みを作る、そのために「何をするのか」ということに焦点を当てる必要があるのではないかと考えます。
我々が考えるバリューチェーンとデータチェーンの連携
バリューチェーンは経営学者マイケルポーターにより導入された概念であり、
企業が製品を設計、生産、販売、配送、サポートするために遂行する活動の集合
ジョアン・マグレッタ (著), 櫻井祐子 (著), 櫻井 祐子 (翻訳) . (2012). 〔エッセンシャル版〕マイケル・ポーターの競争戦略. 早川書房.
とされます。我々が考えるバリューチェーンとデータチェーンの連携とは、それら活動の諸々から発生するデータを収集、加工し、そこから付加価値を創造し川上・川下の活動に還元するような連鎖(チェーン)です。
[図表2 バリューチェーン]
既存の頑健な価値連鎖の中にこの仕組みを作るのは容易ではありません。例えば部署間でのセクショナリズムがデータ連携を躊躇させることもあるかもしれません。また収集したデータの管理や質の維持を行うガバナンスの問題もあります。2010年代に登場したDMP7DMP:Data Management Platformはこのようなデータマネジメントの問題の幾らかには有効でした。しかし付加価値創造とそのバリューチェーンへの還元という観点からは依然として課題が残ります。ポストコロナの時代はこれらをクリアするデータチェーンの設計が大きなテーマになると考えます。
Society 5.0 との関連
冒頭で述べたように、Society 5.0はサイバー空間とフィジカル空間が”高度に融合”し、データやAIで生み出した価値をユーザに提供するような世界を提唱しています。”高度に融合”するためには、先ほど述べたバリューチェーンとデータチェーンの高度でかつ連続的な連携が不可欠であるというのが弊社の意見です。例えばモビリティサービスではただ外部のジオグラフィックデータや個々の移動データを集めたデータベースを作るだけでは不足で、それをサービスのバリューチェーンごとに適した形にAIや機械学習で加工して組みこむことが必要です。
今まではサービスとしてどう提供するのかという観点がやや欠けていましたが、ポストコロナの時代は改めて付加価値の創造を意識したデータサイエンスの取組が期待されます。
弊社は分析受託だけではなく、上記を実現するデータビジネス開発支援コンサルティングもご提供しております。