DXの推進とデータ利活用
現代は、事業のスピード化やグローバリゼーション、慢性的な人手不足といった問題に対応するため、DX(デジタルトランスフォーメーション)への対応が叫ばれています。そうした社会情勢を反映して、IT業界で利用されてきた技術が、医療・製造業・金融などといった別業界にも拡がりを見せるようになってきました。特定の業界における事業構造は、その事業にとって最適化された構造を取っていますが、IT業界特有の情報空間上にリソースを有する事業構造はスピード化の大きな強みですが、IT以外の業界の物理的・組織的な事業構造は、情報的な構造と融和的でないことがDX推進の大きな障害となっています。
特にDXにおけるデータ活用部分に注目すると、そうした組織的構造の違いのうち、IT業界で主流だったDWH(データウェアハウス)を用いた中央集権的なデータ管理が、先に挙げたようなIT以外の業界においてはデータドリブンにリソースを活用していくにあたって必ずしも最適な構造とは限らないという課題が表面化し、新たなデータ管理の方法論としてデータメッシュが注目されるようになってきました。
データメッシュとそれを取り巻く時代背景
データメッシュとは、端的にはデータ管理にドメイン駆動設計(DDD)の概念を取り入れた考え方を指します。
ドメイン駆動設計とは、業務の課題領域(ドメイン)に沿ってシステムを開発するソフトウェア開発方法のことで、もともとソフトウェアをビジネス構造に従って設計することでビジネス価値を最大限に高めるため考案されたものでしたが、ソフトウェア開発の分野では広く知られている概念です。その考え方をデータ管理にも流用したのがデータメッシュという考え方です。
データメッシュの考え方が現れた背景として、世の中のビジネス構造の変化のサイクルがますます加速しているにもかかわらず、事業拡大のスピード化と同時に耐久性の高いシステムを実現するという、矛盾した要請に応える必要が出てきたことが挙げられるでしょう。加えて、従来はデータリソースやデータの専門家は希少であったため、コスト削減のため中央集権的な構造になるのは仕方のない側面がありました。現代では、データリソースそのもののコストが下がったことに加え、複雑な実装を実現するためのフレームワークが整備され、単純なタスクはAIに任せることができるようになり、データ管理コストも大きく下がってきました。まとめると、時代の要請と管理コストの低下がデータメッシュを実現可能にしたということです。
さらに付け加えると、これまでデータを集約する目的がデータを分析することが中心であったのに対し、DXで頻出するデータドリブンという言葉に形容されるように、サービスが分析過程を経由せずユーザの要求に対してインタラクティブに即応する必要が出てきており、分析だけの用途にとどまらなくなってきています。
俗な言い方をすれば、データは企業全体を巡る血液のようでもあり、同時に守るべき資産でもあるという捉え方に変わってきており、それ相応にデータを扱うための管理統括手段としてデータメッシュという考え方が生み出されたとも言えるでしょう。

データメッシュに対する誤解
データメッシュはまだ世の中に浸透していない考え方なので、イメージに幾つかの誤解があります。
まず一つ目に、データメッシュは特定の技術的方法論やアーキテクチャパターンを指すわけではなく、データを貴重な資産として考える一連の原則のことを指します。例えば、以前よりデータカタログで著名なInformaticaも自社のサービスにデータメッシュの考え方を取り入れ始めたり、また、Dagsterといった新興のデータオーケストレーションサービスも設計の段階よりデータメッシュの考え方を反映しています。そうしたサービスはデータメッシュにおける技術的側面を担っていますが、前提として社員の理解や部門間連携・データを戦略的資産として取り扱う組織文化を必要としています。それらのうちどちらかが損なわれると、データメッシュが十分な働きを果たすことはできないかもしれません。
もう一つの誤解として、上記で中央集権的な考えとデータメッシュの違いについて述べましたが、データメッシュは中央集権的なデータ管理と必ずしも競合する考え方というわけではないことを強調しておきます。例えば、企業内ですでに中央集権的な構造に最適化させたシステム構造を構築し、それに沿った形で組織構成やナレッジを集約している企業もあります。そうした企業においては、無理にデータメッシュに適合させていく必要もないでしょうし、その必要があったとしても、部分的・段階的に適用・対応していく話になると考えています。
データメッシュは組織構造に依存する考え方であり、中央集権を包含する考え方と捉えると理解がスムーズに進みます。付け加えれば、今日実態として、たとえばデータプロフェッショナルが「データウェアハウス」という用語を使用する場合、BigQueryやSnowflakeといった単体のサービスを指すこともありますが、その意味するところは、コンピューティング クエリ エンジンとデータストレージが別々に備わったアーキテクチャを備えた複合的なクラウドソリューションを指し、時代と共にデータ管理から中央集権的な意味合いが消失してきているとも言えます。
組織間の自律的な連携とデータガバナンス
データメッシュの実現には上記の組織文化のほかに、特に各事業部の自律的な連携と事業部単位でのガバナンス強化が重要です。データにおけるガバナンスとは、DMBOKの言葉を引用すると、データ資産の管理(マネジメント)に対して職務権限を通して統制(コントロール)すること。統制とは、計画を立て、実行し、それを監視することで徹底させることを指します。
自律的な運用手段については、事業部の性格ごとに適した方法がありますので一括りに決めることはできませんが、自律した連携については、APIの統一やルール策定、ユビキタス言語の整理など組織全体でのルールの標準化が必要となります。
また、部門毎に統制を効かせ、連携に統一的なルールを制定することは、データメッシュという話にとどまらず大きな役割を果たします。昨今は、ランサムウェアによる企業の脅迫や、SAPインテグレーションの失敗といった、ガバナンスに起因する大きな事故が立て続けに発生しております。これらはいずれも、セキュリティやマネジメントの単位が大きすぎて管理リソースを集中することができていなかったことが障害を招き、トラブル対応時のルールが全社で統一されていなかったことが事態の収束を遅らせました。
データは現代の様相を反映したものなので、それを組織的に運用し管理する方法も、環境の変化や時代の流れに沿って変えていく必要があります。
AI時代とデータメッシュ
以上、ドメイン化、セキュリティ、ガバナンスについて説明しましたが、最後に最も大きな社会的な流れであるAIの可能性とデータメッシュの親和性について触れてみたいと思います。
企業がAIを利用する流れはますます活発になってきており、医療・金融・工業などさまざまな事業分野において利用検証されています。AIに期待されている最大の特徴は自動化です。これまで人手が必要だった作業の大部分をAIに置き換えることで、オートメーション化の促進と人的コストの削減が期待されています。これまでに説明してきたデータメッシュにも弱点があり、それはその複雑な構造を実現するための管理コストがかかることが挙げられます。しかし、AIは膨大なデータソースからの学習とオートメーション化により高速データメッシュ実装の触媒として作用し、全体的な情報伝達コストを下げる役目を果たします。
以下では、例として医療業界における医療サービスとAIの連携サイクルイメージを示します。以下のサイクルにおけるAI診断やウェアラブルデバイスなどといった一部のサービスはすでに実現されており、法的な問題や倫理的な課題はあるものの、技術的には実用化の目処は立っており普及は時間の問題とされています。こうした事例は海外で先行していますが、日本でも近年の大手資本の立て続けの参入も注目するところです。
AIを用いた高速なサービスのサイクルが実現するためには、多部門間の連携、標準化されたAPI、標準化されたルールを用いながらも、データメッシュを基盤として部門ごとにもガバナンスを設け、各事業ドメイン毎に自律的に活動する必要があることはイメージがつきやすいと思います。
