非構造化データ活用技術で広大なTAMを狙う9つの思考法 〜マルチプロダクトプラットフォーム戦略〜

マルチプロダクトで勝負するDATAFLUCTのプラットフォーム戦略のビジネスモデルの面白さ・新しさを理解してもらいたく、マルチプロダクト戦略について説明します。

1.データ活用市場のどこを狙うか?

データ活用プラットフォーム市場は、ざっくり分けると、「データエンジニアのためのデータ基盤ツール」(ex. SnowFlake, AWS, Databricks など)「アナリスト・機械学習エンジニアのためのデータ分析(BI/BA/ML)ツール市場」(ex. SAS, SPASS, Datarobot, Tableauなど)「サービス利用者のためのデータ活用SaaSツール市場」(ex. zendesk, pardot, outreach, Appierなど)に分けられる。

データ活用市場

ここで、あえてツール市場と言っているが、実際はツール導入に伴い、「カスタマーサポート(分析・構築)」+「開発・運用・保守(DevOps・DataOps・MLOps・AIOps)」などのカスタマーサクセスが発生し、そこの比率が大きい。すなわち、ツール+サービスのリカーリングモデルでこの市場ポテンシャルと言え、世界中で拡大していってる。

米国ではこれらのデータ基盤+ツールを43%の企業が活用できているのに対して、日本は2%しか活用できていないという衝撃な事実もある。(cf. DX白書2021)

この差は、データに対する取り組みの違いにある。米国では、データ活用が得意な会社Google,Netflix,Uber, Wallmartなどが高報酬でデータ人材を集められ、その人たちがさらに高報酬でデータを活用したい会社が引っ張ってきている。

それでも、多くの企業は「ツールを導入しただけでうまく扱えない」ので、それの活用方法や実装などを実現するベンダーが多く存在する。データ基盤へのアクセスが必要になるので常駐型のSESのような形になっているかもしれないし、分析だけ外注するかもしれない。

この市場規模が大きくなるのは、背景に、DXブームがある。デジタルでなかった会社もデジタルに投資して、そのギャップを埋めようとしている。それを支える基盤技術こそがデータ基盤技術であり、そのギャップがうまらないことから大きな期待を寄せられている。(確実に成長する市場だと言える。)

中でも注目すべきは、変わり続けるクラウド技術・特にデータクラウドを構築・運用できる人材=データエンジニアが注目されている。ちなみにDataEngineerはDataScientistの報酬よりも高い。この領域は特に変化のスピードが速く、育成が難しいと言われている。オープンソース化も進んでいない。

分析市場はアナリストや機械学習エンジニアがサポートしてくれるが、これは学習教材が多く提供されていて、内製化が進みつつある領域だ。多くの会社がPythonを学ばせている。育成も内製も難しいがやれないことはないのだ。

しかし、ここでまだマーケットが存在していないのが、「データ活用人材の育成」である。データ活用ってEXCELを使える人のことでは?って思えるかもしれないが、画像・動画・音声・IoTのような新しいデータを前提とした場合、もはや、画像解析・自然言語処理・時系列データ処理と統計学の知識がなければならない。ビジネスに強くても、これらの数理科学とデータエンジニアリングの基礎がないと、真のデータ活用人材になれない。

データ活用のシナリオを描けないと、高級な分析ツールはただのかっこいいツールであり、高級なデータ基盤もただの箱である。

DATAFLUCTは2018年当時、そこにチャンスを見出した。私自身が、数理工学出身でエンジニアリングをかじっておいて、データを活用した新規事業をこれまで数十本以上出してきた私なら市場を狙えると考えたからだ。(2018年時点に感じた)

市場を創造するための仮説は「非構造データを軸としたデータ活用アプリケーション」をフックに、データ基盤・データ分析・データ活用の3市場を一気通貫で狙うことができたならば、データ基盤企業以上に大きなTAMになる。SnowFlake、Databricks、C3.aiなどがあるが、どの企業も数兆円の時価総額がついている。

DATAFLUCTは、日本版Databricksなのである。

(しかし、競合というわけでもない。)

2.非構造データ基盤を軸にした参入シナリオ

何も武器がない一人の個人が、エンタープライズデータ基盤市場にどう食い込んでいくのか、ずっと考えていた。なんのことはない、カモがネギを背負ってやってきてくれた。

私は、JAXAの非常勤職員のオファーをもらった。

企業の衛星データを使うビジネス創出を支援していた。ユースケースを片っ端から調べてみたところ、市場規模はとてつもなく小さかった。その理由としては、衛星データの品質、デリバリー、値段などから、企業が簡単に使うレベルになっていないからということだった。あくまで政府が利用するものが衛星データだった。

衛星データを分析しようとすると、物理的な知識に加え、画像解析と機械学習(深層学習)が必要になった。でも実際のところは、画像解析だけでなく、位置情報解析やPOSデータ解析やSNSなどの地上のデータ解析も必要になってきた。ユーズケースがあくまで、地上のデータを掛け合わせないといけないものばかりだったからだ。

ここに突破口が見えた。

画像・位置情報・モビリティ・センサー・3D・テキストなどEXCELじゃ分析できないようなデータばかりじゃないか。きっとこういうデータを多くの企業が必要になる社会がやってくるはずだ。特にSociety5.0のコンセプトなんて、機械がデータを生み出し続ける社会だし、人工知能・拡張知能なんて音声・文章の文脈を理解しないといけないし、個人情報もさまざまなデータが増えると思った。

すべてのデータビジネスの行き着く先は、

「マルチモーダルデータ活用になる」

と確信が持てた。ただ、それが何かは多くの人の頭の中に無いようだ。

衛星データは、お金を払えば、手に入るデータで、ここでアルゴリズムやノウハウを溜めながら、企業の新しいデータ活用(非構造データ活用)のポジションを狙えば、会社の規模も大きくなり、結果として、衛星データも含む、あらゆるデータ活用カンパニーになれると考えた。

どうしたら日本を代表する企業が蝿のような小さなベンチャー企業にデータを渡すだろうか。

まずは、マウントを取ろう。JAXAの名前を借りて、JAXAベンチャーになった。これ自体はほとんど意味がなかった。

SaaS型のプロダクトを作った。外部データを集めて我々がつくったアルゴリズムをベースに、企業のデータからアルゴリズムを作れるというSaaS。SaaSというよりもDataScienceAs A Service。

多くの大企業がマルチモーダルデータ活用のチャンスに気づく前に、必要なアルゴリズムを総取りしておくにはどうすれば良いかを考えた。

これまでデータを外に出さなかった大きな産業たとえば、物流、不動産、食品、医療、エネルギー、教育、金融、製造。可能性はめっちゃある。医療とか教育とか金融とかはすぐにデータくれないだろうな。

しかし、そうでは無い業界もあるはずだ。

その仮説を立てて、異なる業界で、異なるデータ技術を使ったプロダクトを同時にリリースする「データサイエンススタートアップスタジオ構想」が生まれた。成功は問わない。

目的は、データの取得・アルゴリズム構築・ノウハウ獲得だった。それが創業時から変わらない戦略=「非構造化データ獲得のためのマルチプロダクト戦略」になっている。

最初の年。

数十社のデータ活用コンサルを請け負った。自分がしならない業界、バラバラの業界のみ受け付けた。コンサルをしながら、アイデアを考え、100本くらいのデータ活用SaaSのロングリストができた。

アイデアのレベルはこんなのだ。スマートモビリティから得られるデータを高速で変換して、他のモビリティカンパニーに流通する基盤。そのために必要なアプリケーションはBtoB向けモビリティの労務管理アプリSaaSを作ろう。それを実現するためには、リアルタイムでデータを変換して、アップロードする技術。地図に落とし込む技術が含まれる。エッジAIとリアルタイム処理ができるクラウド基盤が必要になるわけだ。

このアイデアは、大手モビリティ企業の新規事業立ち上げ支援で出てきたアイデアだ。( DATAFLUCT mobility.というサービスで2020年の春に実証実験を行った)

いずれにせよ、その100本のロングリストを持ちながら、実現可能で勝ち目があるアイデアから実行にうつしていった。

コア技術を継承するために事業を作る、事業を作るためにコア技術を作る、どっちもやる。

それから以降の話は、ローンチ本数は「DATAFLUCT prtimes」を検索してほしい。

3.世界で勝てる技術を手に入れるために今できることは

起業する時2018年時点で、世界の市場を見た。

DataLakeを軸としたデータプラットフォームが流行っていた。

しかし、日本では全くそのニーズはなかった。2019年に起業したとして、2024年くらいに上場して、グローバル戦略を推し進めるための武器がほしいな。

多くの企業を支援する中で見えてきたのは、非構造データ活用技術へのニーズだった。日本企業はAWSにもAzureにもGCPにもデータを渡しておらず、オンプレミスでデータを保有していた。日本企業は、製造や食品や流通や建設など独自のデータを持っていた。そのデータにアクセスするために、3年間で30本以上のプロジェクト(プロダクト開発を前提としたプロジェクト)を実施した。

すべては、非構造化データを活用するコア技術を、業界ごとに獲得するために。

事業を始めた当初は見えていなかったことは。「データ基盤技術」にお金を払うのか、「データ活用アプリケーション」にお金を払うのか、だった。

2021年時点で分析技術がコモディティになることが見えてきた。つまり、「データ分析ツール」の開発シャードルはそれほど高くないし、モデル構築よりも、データとか運用などのMLOpsなどの方がパフォーマンスに大きな影響を与えることがわかった。

そのようにして、DATAFLUCTは、「非構造データ活用」を軸として「データ基盤事業(COE・データ基盤部署向け)」「データ活用Apps事業(事業部向け)」の二つを事業の軸とすると決めた。

しかしながら、AI中心主義でもなく、基盤技術中心でも、マルチモーダルデータ中心に考えると、全ての企業が競争優位を手に入れられる。

4.エンタープライズ変革を支援するベンダーフリー

次に顧客開拓について説明をする。

DFがPMFできたとおもったのは、

AirLake+部署ごとの課題解決で顧客のビジネス成功ができる

と感じた瞬間だった。

CDOがやってきても、どれだけITコンサルに発注しても、多くの企業は既存システムリプレイスを望まなかった。そりゃそうだろう。リプレイスによって得られる収益インパクトについて、データ部門もシステム部門も責任を負いたく無い。かといえって、システムがわからない営業部門の人にも難しい。

苦肉の先で、多くの企業は、既存の基幹システムをリプレイスせず時、ボトムアップで変革を起こす手段を考える。

以前の私なら、CDOをたてて、トップダウンで、根本的なことを取り組むことをおすすめした。今では、向き合っている部署の課題にしっかり向き合って解決していくことを優先すべきだとわかった。

考えてもみればわかる。

DXブームで盛り上がっているのは経営層だけで現場では無いことを。

トップダウンでだけでは物事は進まないことを。

なのでそんなに大きなお金は動かない。企業丸ごと変革するDXを提案するのはやめよう。ベンダーリプレイスやベンダーロックインの設計は絶対にNGになるだろう。

DFは、マイクロサービス的な、部分最適が得意な日本企業向けのエンタープライズプロダクトでFITすることを考え、それがうまくいった。

現場の課題に向き合い、部署レベルの課題を解決するアプリケーションを提供する。

そのパフォーマンスを上げるために、ベンダーフリーアプローチ(他のベンダーとも連携)でDFのコア技術だけを活用できるようにする。

この取り組みが評価され、各部門ごとの課題を解決する。そこであたらなニーズに出会い、新たな挑戦する案件や新たな事業テーマが手に入る。

全て共通するのは、非構造化データ活用案件だ。AI開発パートナーではなく、非構造化データ活用パートナーとしてDFのことを認識できたら次の段階にはいっていく。

5.部署ごとのサクセスモデルを企業全体へ。変革パートナーたれ。

プロダクトを通して、カスタマーサクセスを実現することが偉大なマークベニオフから学んだことだった。

20年経った今でもデータサイエンス領域で体現している企業はいない。

企業の部署ごとの課題解決に向き合いつつ、次から次へと課題解決アプリを作ることができる組織があるのならば、おそらくそれは、真の意味で変革パートナーと言えるだろう。

とにかくすごい技術を持っていたら、企業が案件をくれる。

それは違う。

ユニークなデータ活用アイデアを持っていたら、案件発注してくれる。

それも違った。

とても悪い、悪意のある、企業の担当者が、DFをどのように認識するかといえば、「数百万円でアルゴリズムを発注して、あとは自分達でやろう」「設計方法だけ自分たちでやろう」「ピッチだけしてもらってお抱えのコンサルに作ってもらおう」みたいな見方で、我々のようなスタートアップを認識している。(悪い大企業の生々しい話はいろんなところで愚痴っているので、機会あれば実際にあった怖いPOCというお話しをしたい)

企業担当者と長期的な、持続可能な、関係性を築くために、私たちはどうあるべきなのだろうか。

営業部門はこの問題に向き合っていく。

企業の成長に寄り添い、共に成長していくためのビジネスモデルは、「コンサルではお金をなるべく取らないこと」「アイデアをしっかり隠すこと」「特許を出願しておくこと」「コアのデータをこちらで持っておくこと」「社内人材では難しい分析ができるようになること」「運用・保守・改善でパフォーマンスを上げること」「高い利益率を維持できること」。これらの課題を乗り越えないと、DFはサステナブルになれない。

よって生まれたのが「プロダクト+カスタマーサクセス」モデルだ。

データサイエンスサクセスモデル

顧客の課題に応じて提案することはせずに、顧客の課題を把握した上で、プロダクトを作って、企業と取引関係を作るということだ。プロダクトをうまく使ってもらうための、サクセスモデルを部署ごとに作り上げていく。これは、顧客のビジネスがどう進化していくか、予測することができれば実現可能である。

このようなプロダクトを軸とした複数の業界へカスタマーサクセスが浸透し始めているので、DFはサステナブルになれると確信が得られた。

ベニオフさんがセールスの部署でやったことを、非行構造データ活用でアップデートしていくのがDFであり、実現するまでに3年かかった。

6.一見非合理なマルチプロダクト戦略を採用

VCの皆さんと話すと、凝り固まった思考で、まずは一つの業界に絞ってシェアを取りに行きましょう。それから他の業界に横展開行きましょう。と上から目線で言ってくれるのだけど、日本を代表する企業のDX担当のみなさまと対峙している私からすると、そうも言ってられない。現実は、現場を知っている私からすれば違う。

SMBに特化したSaaS戦略を、データ保有する数兆円企業に当てはめられるだろうか。Dataの世界は、WTAである。

産業構造をみれば、DXはトップレイヤーからはじまり、EXCELが使用できる人も、トップレイヤーにて、データの価値がわかる人も、トップレイヤーにいる。

だから、データを狙うなら、エンタープライズからしかない。

エンタープライズを1社口説いたら、他のエンタープライズに行きにくくなる。業界2位の会社とガチで一緒にビジネスを作ることを選んだら、3位、4位の会社と同時に取引するのは現実的に考えて無理じゃ無い。2位の会社と一緒に、その業界のSMBビジネスを展開した方がよくないか、と思うのだ。

なので、私たちは、最初から、あらゆる業界のトップ企業に食い込むために、マルチプロダクト戦略を実行しようと思った。特定の業界だけに強くなるのではなく、一見遠回りだが、あらゆる業界のコアデータを手に入れにいくのだと。

これが最初に書いた絵。

マルチプロダクト戦略ループ

実際このようにビジネスははじめていて、次から次へと新しい「技術のニーズ」「データ活用のアイデア」が生まれてくる。特許のアイデアなんてなくなることはない。

ダブルハーベストループ

今やこの仕組みが「新しいビジネスモデルを生み出し続けるプラットフォーム」になっている。これを繰り返した結果、最強の非構造データ活用のホリゾンタルPaaSができあがるはずだろう。

7.民主化テクノロジープロバイダー

創業時の合言葉は、Issue Driven, Not DataDriven.

多くのAIスタートアップは技術を語っていた。

私たちは、データで解決すべき課題を語っていた。

どんな技術を使うのかは、後から考えればよかった。

課題なしにはビジネスが生まれないのだから。

あるメガバンクに呼ばれ、ピッチをさせてもらった時の話だ。

会場から出てきた質問は「ところで、御社の技術はどんな技術でしょうか?どこに強みがあるのでしょうか?」と言われた。

私の答えはそうですね。「ある部署があるビジネス上の課題があって、それを解決するために、世の中のデータを集め、世の中のAI技術を使って、誰もが使えるデータ基盤を使って、唯一無二のアプリケーションをどこよりも早く、安く、同時に、大量に作れる技術でしょうか。」

ところで、この会場にいる企業の皆様の中で、同様のことができる会社はありますか?、と言っていない。私は社員が一人で同時に12本作っていた。社員が多くいれば、複数のイノベーションが起きると思っているがそれは勘違いだ。

社員が1名でも、熱い気持ちがあれば、データ活用の民主化技術があれば、複数の課題解決を同時にできるはず。

そういうイノベーションの火種を社内につくるのが私の使命だ。真の変革を目指すためには、多くの企業が、多くのデータ、アルゴリズム、クラウド技術を縦横無尽に使えるようにした方がいい。

いうなれば、私たちは「データの民主化を実現するためのプロバイダー」である。企業が自走するため、内製化のために、私たちはアルゴリズムを作る必要はなかったりする。上記でのプロダクトサクセスの話と矛盾しないことは、設計思想こそがプロダクトの根幹にあるからと説明しておきたい。

8.社会実装のための未来のデータ基盤とは

データ活用の種をどうやって見つけてくるのかという話をしよう。

データと言えば、大抵は、売上があがるのか、コストが削減できるのか、という話になる。

しかし、企業価値=社会や株主からの期待と考えた場合、データ活用の目的をP/Lのみに収斂するのは危険だ。P/Lではなく、B/SやC/Fにアプローチできるようなデータ活用はないだろうか。

これまでの資本主義では説明できないようなESGという観点でのデータ活用はないだろうか。

私は長期的な視点で社会の変化、社会課題、技術の変化に着目してみた。

スマートシティ、脱炭素、パーソナルデータ、SDGsがどう企業のデータ活用に影響を与えていくか。最近では、5G、自動運転、メタバース、自律分散組織、働き方変革、ジェンダー問題などがどうデータ活用にインパクトを与えていくのかをよく考えている。

データ基盤技術は実のところ、最後にやってくる。

まず、社会の変化があり、そこから分析技術(AI)が発展し、それらを運用する基盤技術が発展する。Amazonがあり、AWSがうまれたように、Googleがあり、GCPが生まれたように、クラウドはアプリケーションありきで、基盤が進化した。そう考えれば、未来の予兆・社会の変化から考えれば、必要なデータ基盤は定義できると踏んだ。

データ基盤技術は、中身が見えなく、パフォーマンスに影響与えるので、先行優位が働く。社会の流れを見て、社会課題を解決する、データ分析技術・データ基盤技術で勝負することにした。

今、企業が活用したいのは、主に非構造データであり、SaaS型ではなく、PaaS型のアプリケーションへのニーズがかなり高まっている。次のニーズは日本語(自然言語)解析、拡張知能、CPS、パーソナルデータ流通、協調学習基盤、マスタクレンジング、データメッシュなどユニークな技術ニーズが高まっている。

社会課題にFITする技術を未来志向で作っていくのがDFコア戦略である。

STEP1: 解くべき社会課題を決める。

STEP2: どんなデータモデルか定義する。

STEP3: 具体的に活用されるアプリケーションを作る。

STEP4: スケールする際に必要な技術を定義する。

STEP5: データ基盤プロダクトに落とし込んでいく。

このサイクルが回り始めた。

非構造データや外部データを活用してビジネスを支援する会社になった。コアプロダクトは、非構造データ活用Appsと非構造データプラットフォーム

この技術スタックは、既存のデータクラウドには持たないものであり、DATAFLUCTが自らデータを手に入れているから実現できるアーキテクチャーである。

9.世界一を狙うための逆張り!

自分は他人とは違ったことをやりたい。

言われたことをやりたく無い。

教科書をハックしたい。

誰かのノウハウにはもっとその上があるはずだ。

とずっと思ってこの年までやってきたし、これからもそうありたいと思った。

MBAに通って、経営の基本もイノベーションの理論も学んだ。

それほど大きな成功をしていないスタートアップの真似をしたところで、世界一は取れないだろうな。

マスク、ベゾズ、ベニオフあたりを超えられるようにするためには、彼らが作ったスタートアップエコシステムの裏を書く必要がある。そうおもって、スタートアップの教科書に書いてある基本を疑ってみた。

100年後も残るビジネスモデルとは、長期的模倣困難性とは。

1.大きなTAM って、外からそう定義されている時点でもうレッドオーシャン決まりだ。カオスマップの中に位置付けられ、満足しているっていう時点で、シェアの奪い合いにある。だから、DFは絶妙にわかりにくいが、とてつもなくでかい市場を狙った。

2.AI-OCR、AIチャットボット、自動分析ツールはとても分かりやすいバリューだ。そのプロセスを短縮してくれるので、効果が出る。だから、UXや技術の戦いになる。でも、データ活用ってとてもわかりにくい。桶屋が儲かるロジックに似ているのだ。でも、それに気づいたAmazon、Netflixはすごいぞ。どの会社も効果が出るまでとても時間がかかっている。でも、データの価値を信じている企業だった。私たちはそこに続く企業を支援したい。

3.データ活用の目的は、PLだけではわからない。人間中心にで考えた時に、環境のことを考えた時に、今の社会背景を考えた時に、さまざまな価値の種類があるはずである。DFでは、象徴的な事業として脱炭素・フードロス・スマートシティ・パーソナルデータ活用を選んだ。PLだけじゃないテーマを狙おう。

4.「選択と集中」、限りある資源で狙うのは一つに絞った方がいい。言っていることはよくわかる。ホリゾンタルPaaSを狙うなら、データ活用の市場は、「業界」ではなく、「仕組み」に集中すべきだ。

5.プロダクト開発は一つにしたらうまくいく。そんなことはない、同時にさまざまなプロダクトを作ってみて、失敗して、失敗して、失敗して、そこからピボットして、真にPMFできるプロダクト開発に出会う。30本を30年かけてつくるか、30本を3年で作るかといえば、後者の方が成功確率高まるのでは。(もちろん、徹底的な撤退基準を持つ)

6.すぐにヒアリングに行けて、意思決定してもらい安いSMBセールスにいきがち。エンタープライズは時間がかかりとても時間がかかる。でも、一度入ったら、いろんな部署の課題を教えてくれる。導入スピードが少々かかってもこっちの方がインパクトがあるだろう。データの種類も量も多いし。

7.技術を持たない会社は死んでいくのだが、基礎技術に頼りすぎなのが日本人のダメなところ。特許もビジネス観点で考えられていないものばかりだ。データでインパクトを残すためには、まずは、課題にフォーカスすることが大事だ。だから、データサイエンス版商社を作ろうと思った。研究開発ベンチャーではなく。

最後に

ここまで読んでくださってありがとうございます。これは社内ブログ向けに書いたものですが、猛烈に仲間が欲しくてブログにしました。

ここまでよんで、DFに興味持ってくださった方、ぜひカジュアル面談しましょう。データサイエンスに経験なくても、学びによって現状を変えられるリーダーシップがある方であれば活躍できる機会があります。

ご連絡お待ちしています。

以上

--

--

久米村隼人 Hayato Kumemura / 株式会社DATAFLUCT 代表取締役CEO

datasciece for everybusiness! a Data Science Startup Studio DATAFLUCT CEO / ex-Nikkei,Recruit,MACROMILL,Benesse,JAXA.