DATAFLUCTがデータ活用の民主化に挑戦できる5つの理由

DATAFLUCTがデータ活用の民主化に挑戦できる5つの理由

昨今のDXブームの波に乗り、また新たに10–30名ほど正社員+業務委託メンバーを増やしたい急成長フェーズに入りました。

DATAFLUCT(以下、DF)ってどんな会社だろう、って調べている人に向けて、今、取り組んでいることと、今後チャレンジすることについて説明したいと思います。これからDFの面接を受ける人には事前に読んでもらって、代表の私に質問してもらえたら嬉しいです。

今、3月で繁忙期ですが、「本当にチャレンジしたいことはなんだろうか」「今後はどんなプロダクトを出していきたいのか」「どんな価値を提供していきたいのか」を日々考えています。

経済環境が目まぐるしく変わり続けている先の読めない中で、ニーズに適応させようとすればするほど、新たなデータサイエンスサービスを生み出せると自負しています。その一方で、継続的な収益に結びつかない領域はどんどん撤退しています。”リリースする”、”フィードバックをもらう”、”ピボットする”、という一連の顧客ニーズへのアジャストが高速で繰り返されており、最初に想像していたサービスの形と異なる事が多いです。

今のDFにジョインすると、確実にその変化の渦に飲み込まれます。たくさんプロダクトを作って、高速で仮説検証を繰り返すことができるとても楽しい時期を味わえます。

そんなこんなで、現在のDATAFLUCTの事業領域を図示するとこんな感じになります。

Full-Stuck Data Science Studio:DATAFLUCT

弊社は、データサイエンススタートアップスタジオというコンセプトで食品から始めましたが、様々な業界ごとのアルゴリズム構築をしているプロセスで、マルチモーダルな機械学習プラットフォームを開発しました。その技術をDX支援ということで、企業に提供しはじめました。

まだまだ、駆け出しのスタートアップですが、この仕組みでグローバルNo1の機械学習プラットフォーマーになれると思っています。それがなぜできるのか、という点において5つの理由をまとめました。

1.DFは”データ活用の民主化”を実現するバリューの提供ができている。

”データ活用の民主化”

統計学やエンジニアリングの専門知識なしに、大手企業ではなく、多くの企業がデータ活用の恩恵が受けられることを指します。

DFのミッションは、あらゆる業界のデータをつなぎ、社会全体が最適になるようなアルゴリズム実装です。そのためにできることは、社会に影響を与えるエンタープライズ企業に対して、なるべく「簡単に」「安価に」データサイエンスを使ってもらうことです。

データサイエンスは概念が難しいものばかりです。特に、統計学や数学を大学等で学習したことがないビジネスの意思決定者にとって、そのハードルが超えるようなUXを実装して一人でも多くの方にその恩恵が受けられるようにするというアプローチ方法を選択しています。

創業より続けてきたこの取り組みが、具体的に、さまざまな業界で導入が進んでいます。「Valueが届けられている」という手応えを感じています。

DATAFLUCTが届けているValue

データ活用の民主化(技術の課題解決、ビジネスの課題解決)に取り組みたいという方にとって、DFは最強の選択肢になると思います。

2.DFは”フルスタックサービス”を提供できる稀有なポジションである。

”フルスタックサービス”

それは、一気通貫で、データサイエンスのビジネス要件定義から運用まで提供できることです。

会社でデータサイエンスを実装しようとすると、ビジネスの課題抽出、データの整備、アルゴリズムの構築、システム実装、運用という形で、「コンサル会社」「AIベンチャー・データ分析企業」「システム開発」「機械学習運用」というバラバラの会社に発注しなければなりませんでした。

DFでは、シリアルアントレプレナー、データサイエンティスト、クラウドエンジニア、フルスタックエンジニアが集結した組織であり、少ないメンバーでありながら、すべての工程のサービス提供が一気通貫でできています。

フルスタックデータサイエンスサービス

元々、会社員の時に、外資コンサルの会社にかなりの額のお金を支払ったが、満足できるものができなかったという原体験が私にはありました。意外と簡単なのになー、って思うものを、よくわからないからという理由で、コンサル、AIベンチャー、SIerに割高なコストを払っています。

DFは、高度にテンプレート化された自社PaaSや開発基盤の活用で、一般的な会社の5分の1くらいのコストで全て実装できる強みがあります。(現状は、SIerやコンサルなどと連携して顧客提案を行なう事が多い)

DFに発注すれば、企業は3–5倍速で実現できるという価値を届けることができています。

”フルスタックサービス”に興味を持ち、我こそは、フルスタックができる人材になりたいという人にとっては、恵まれた環境だと思います。(これしかやりたくないっていう人には向かないです)

3.スタートアップスタジオモデルで高速プロダクトローンチが可能である。

“スタートアップスタジオ”

新しい事業を同時多発的に連続して生み出していく仕組みのことを指します。

私の会社員時代とDFでの事業ローンチ数は、30を超えています。たくさんの失敗もしました。そこから得られたのは、どのようにすれば、高速に仮説検証ができ、市場に出せるのか、というフレームワークです。

事業開発スプリントという方法で、これまでDFでも10数本のサービスがローンチできましたし、現時点も5–10本程度の仕込みを行なっています。

ステージゲートシステム(スタートアップスタジオモデル)

具体的なステップは次の通りです。

1.優秀なDS(システムアーキテクト:CTO)と優秀な人間中心設計専門家(ビジネスアーキテクト:CEO)が手を組むことで、擬似的なスタートアップを組成します。

2.ステージゲートシステムを活用して、KPIごとに自由に使える予算を決めます。

3.社会や企業の課題を発見し、自らデータを手に入れ、オリジナルのアルゴリズムを作ります。

4.アルゴリズムがうまく動かせるような業務に特化したAutoMLサービスを開発し、ローンチし、使ってもらいます。

5.これらのプロセスを繰り返す事で、アプローチできていない業界に入り込む事が成功しています。

6.この仕組みの副産物として、データだけではなく、リーダーシップ人材の育成、プラットフォーム基盤構築ノウハウが蓄積しています。

プロジェクトの目標は、リカーリングを可能にするソフトウェアサービスの開発、としています。

スタートアップスタジオモデルで、実は、「異なるデータ」「異なる技術」「異なる業界」を選択しました。事業の成功確率ではなく、技術・ノウハウ・データ獲得を目的に事業の選択を行なっています。

テーマ×データ活用レベル×価値レベルによって、マトリクスを構成し、優先順位をつけて順次具現化に取り組んでいます。

もともと食品領域からスタートしましたが、店舗、不動産、金融、物流、都市開発、教育、HR、脱炭素など幅広い領域でさまざまなデータ活用サービスを同時多発的に仕込んでいます。

事業テーマ・プロダクトの選び方

DFでは、「マルチモーダルなデータを活用したアルゴリズム開発」「事業の課題を解決する意思決定支援サービス」が融合したサービスを基本構成としているので、事業課題の抽出方法と、サービスレベルを型化することで、高速にさまざまなサービスのテストができるようになっています。

もし、安全な環境下でデータサイエンス・スタートアップを経験したいなら、DFのスタートアップスタジオモデルを活用して欲しいです。

4.DFは”スパイラルアップ”による無限領域展開を志向している。

“スパイラルアップ”

高速でPDCAを回しながら、平面ではなく、Z軸に上昇していくこと。

一般的なVCにピッチをすると、盲目的に「受託案件を辞めたほうがいい」「一つの自社サービスにフォーカスしたほうがいい」とアドバイスをいただきます。

私たちの会社は、データサイエンスの民主化を実現するプラットフォーム企業であり、そのために、あえて、「受託(DX)」「複数の自社サービス」「プラットフォーム」の3本柱で事業展開をしています。

そのように説明すると、10人中9人のVCは、意味がわからないと言われます。

逆に言えば、多くのVCやスタートアップが、「この戦略は間違えている」「非合理的だ」と思っていることを逆手にとり、DFでは、自己増殖型に領域展開ができる仕組みを構築しました。(実際問題、一つの業界、一つの機械学習プロダクトだけでスケールしても市場規模は小さい)

すでに、DFでは自社サービスと受託案件体制を両立し、様々な課題解決が可能になっているという事実、そして、キャッシュと技術とデータを生み出し続ける時間が経てば経つほどDFが強くなってPaaSが強くなる仕組みがあります。

売上的には、顧客の課題を解決するデータサイエンスサービスをオーダーメイドで高速に作っているように見える点で「受託開発」なのだが、企業のデータ活用が黎明期である今、最新のノウハウが蓄積できるいい手段だと考えています。

DATAFLUCTのスパイラルアップモデル

Z軸に広がるスパイラルモデルではなく、4次元で広がるのが更なる特徴になっています。すなわち、スタートアップスタジオモデルと、スパイラルモデルが融合すると、無限に、事業領域展開ができるようになっています。

DATAFLUCTの無限領域展開モデル

「なぜこうもたくさんの技術を作り続けるのか」

「なぜ多種多様なデータが必要なのか」

自然言語処理が得意な会社と、ルート最適化ができる会社と、エッジAIが作れる会社にバラバラに発注するの、面倒でしょう?

DFならAll-In-Oneです。

全部で実績ありますし、安いです。

という価値提案がぶっ刺さっています。

この業界に飽きてしまったよ!っていうDX/AIコンサルのみなさん、ぜひDFであらゆる業界のデータ活用を推進していきませんか。大衆化している技術であれば、なんでもいける会社だと思います。

5.DFは”マルチモーダル機械学習”プラットフォームでグローバルスケールを狙う。

”マルチモーダル機械学習”

「モーダル」という言葉は機械学習アルゴリズムに投入するデータ種類(画像、音声、テキストなど)を意味します。

マルチモーダル機械学習とは、様々な種類の入力情報を利用する機械学習です。

DATAFLUCTのすべてのサービスは、シングルモーダル機械学習ではなく、マルチモーダル機械学習になっています。

マルチモーダルな機械学習の例としては

・気象データと衛星画像を組み合わせて天気予測する

・画像から表情を読み取り、音から感情を読み取り、言葉からコンテキストを読み取り、最適な答えをする

・GPSデータと不動産情報を組み合わせて土地の価値を推定する

などに使われています。

しかしながら、”マルチモーダル機械学習”は、どのように扱うのが最適なのかということは明らかになっておらず、盛んに研究が行われています。要するに、多種多様なレシピを試して、一番美味しい料理を作る競争が行われていることを意味します。

DFでは、スパイラルアップによって得られた「マルチモーダルデータ」「機械学習アルゴリズム」「AI技術」「クラウド環境」「ノウハウ(えられる結果についての推奨)」などが簡単に使えて、グローバルスケールできるように、1年前からプラットフォーム構築を行なっています。

”マルチモーダル機械学習プラットフォーム”なら世界を狙える

類似企業はあまりないですが、機械学習プラットフォームという点でのベンチマークは、C3.ai です。といっても、マルチモーダル機械学習という点では、他のAutoMLプレイヤーもまだまだこれからといった感じです。

DFでは、以下の点に注力し、プラットフォーム開発を課題ドリブンで推進していきます。

End-to-End でデータ活用の民主化を推進する”マルチモーダル機械学習”プラットフォーム

1.”マルチモーダル機械学習”で勝負する

DFのサービスは、データをアップロードするだけで、結果が得られるという、AutoML的なアプローチをしているものばかりです。しかしながら、多くの会社はそれほど大量のデータを持っていません。そこで、DFでは、外部データを活用したオリジナルアルゴリズムを提供することで、データがそれほどなくても、比較的安価に精度の高い結果が得られるになりました。

マルチモーダルなデータ活用において、精度を上げるために、外部からデータを集めてきて、AI/機械学習を賢くさせる事が必要になり、それがめっちゃ簡単にできるプラットフォームやSaaSを開発していきます。

2.End-to-Endのサービスで基盤構築周辺の痒いところに手が届くようにする。

BIサービスはたくさん存在していますが、マルチクラウドデータ基盤(ex.snowflake)、ETL、データ収集、データマネジメント(ex.informatica)、AutoML(ex.DataRobot)、MLOPsのサービスはまだまだ選択肢が少ない状況です。DSとして、便利なものばかりですが、これらのツールを入れるほどコストが上がってしまいます。

DFでは、特徴量エンジニアリングに注力いただけるように、なるべく前後のプロセス改善ができるサービスを、安価に導入できるようにしたいです。

機械学習データプラットフォーム市場はまだまだ大手企業のシェアが低い状況で、かつ、導入単価もとても高いものです。とても大きな企業しか、導入できない事実があると思います。

3.何より楽しくビギナーからプロまでの成長を伴走できるように。

一線で活躍するデータサイエンティストのためのサービスではなく、ビギナーからプロに成長していくすべての過程で使っていただけるサービスを開発し続けたいと思っています。

はじめてデータ分析をしてみた時のように。

はじめて機会学習のアプリケーションを構築した時のように。

はじめてディープラーニングを使ってみた時のように。

データを使っていると楽しい、って思える瞬間を大切にして、DFをグローバルで愛されるブランドにしていきたいと思っています。

残念ながら、グローバルなデータ活用PaaSの中に、日本のブランドは入っていません。DFでは1年以内にまずはDFサービスが海外で使われている状態を目指したいと思っています。

2030年時点で

”グローバルのデータサイエンス(主に機械学習)のエンタープライズ市場で最も使われているブランドになる”

という目標を置いています。”データを商いに”というビジョンの実現に向けて、本気で世界中で通用する汎用的なサービス開発に挑んでいます。

この船に乗っていただけるデータエンジニア、MLOpsエンジニア、フルスタックエンジニア、コンピュータビジョンエンジニアを探しております。

DATAFLUCTの採用情報はこちらから

(業務委託からでも、いきなり正社員からでも構いませんので、門を叩いてください)

--

--

久米村隼人 Hayato Kumemura / 株式会社DATAFLUCT 代表取締役CEO

datasciece for everybusiness! a Data Science Startup Studio DATAFLUCT CEO / ex-Nikkei,Recruit,MACROMILL,Benesse,JAXA.