2024.2.28 ITトレンド全般 InfoCom T&S World Trend Report

オルタナティブデータ活用の現状と課題

Image by yatsusimnetcojp from Pixabay

はじめに

ビジネスにおけるデータ活用が進んでおり、生成AIを中心としたAI技術の発展・普及によって今後もデータの重要性は増すものと想像される。スイスのビジネススクールIMD(International Institute for Management Development)が毎年公表している「世界デジタル競争力ランキング(World Digital Competitiveness Ranking)」では、さまざまな観点からデジタル競争力を評価しており[1]、その中に「ビッグデータとアナリティクスの活用(Use of big data and analytics)」という項目がある。オピニオン調査において、企業は意思決定をサポートするためにビッグデータと分析を用いるのが得意かどうかを質問し、[0-10]で回答を得たもので、2023年版での当該項目における日本の順位は64カ国中64位と最下位となっている。これは主観的な回答によるものであり、日本人ならではの控えめな評価を反映した結果とも考えられるものの、世界的にみて日本企業のデータを活用した意思決定が進んでいるとはいえない状況にある。

そのような中、意思決定をサポートするためのデータは増えており、これまで伝統的に使われてきたデータ(トラディショナルデータ:企業の決算情報、プレスリリース、IR情報、公的統計等)だけではなく、非伝統的なデータ(オルタナティブデータ:POSデータ、位置情報、衛星写真、SNSデータ等)も注目されている(図1)。

【図1】オルタナティブデータとは

【図1】オルタナティブデータとは
(出典:一般社団法人オルタナティブデータ推進協議会HP)

例えば、企業の経営状況や日本の経済状況について知りたい場合、これまでは企業の決算情報や公的統計(家計調査、鉱工業生産指数、GDP等)をみることが一般的だった。これに対して、オルタナティブデータでは、スーパーの駐車場や石油の備蓄量などを衛星写真によって把握し、企業の経営状況や日本の経済状況をほぼリアルタイムで推測することが可能になってきている。背景には、実世界のデータがデジタル化されるようになったことやAI技術の発展、スピーディーに足元の状況を把握したいといったニーズの高まりがある。そこで、本稿では、オルタナティブデータの動向についてみていきたい。

オルタナティブデータの特徴

オルタナティブデータはトラディショナルデータに対してさまざまな違いがある。

<データ形式>

トラディショナルデータは公的な側面が強く、データの形式が決まっており、かつ文字や数値データが中心なのに対して、オルタナティブデータは写真や音声、映像など多岐にわたる。また、文字や数値データであっても決まった形式・定義が存在せず、公表主体によって異なっていることが多い。

<速報性>

トラディショナルデータは集計から公表までに数カ月の時間を要するため、公表されたデータをみて数カ月前の状況を把握することになるのが一般的である。また、公表される頻度も1カ月または1年に1度といった間隔が多く、知りたいタイミングで足元のデータが入手できるわけではない。一方、オルタナティブデータは日次単位や1時間単位などの頻度で公開されることも多く、いち早く足元の状況を推測することが可能である。そのため、新型コロナウイルス感染症の流行初期にはクレジットカードデータを用いて家計の支出動向を推測し、景気判断に活用された[2]

<正確性>

上述のとおり、オルタナティブデータの速報性には優位性があるものの、トラディショナルデータのように適切に集計されているわけではないため、利用する際には正確性への注意が必要になる。例えば、特定のクレジットカード会社のデータのみでは、年代や所得階級などに偏りがある可能性が高く、必ずしも日本全体の動向を示しているとは限らない。また、SNSデータについてはbot(事前に設定された処理を自動的に実行するプログラム)による投稿が交じっていたり、若者中心のユーザー層であったりといった特徴から正確な洞察を得るためにはそれ相応のコストを要する。Web関連のデータについては、アクセスしている人の性別や年代、家族構成などの推測が必要であり、また、アクセスされたページにはどのような情報が掲載されていたのかといった関連づけの作業も必要となる。

<粒度>

トラディショナルデータは日本全体などマクロな動向を把握するデータであることが多く、オルタナティブデータはより粒度が細かく局所的な動向を示すデータであることが多い。例えば、トラディショナルデータである家計調査からは日本全体の消費状況が把握でき、オルタナティブデータであるPOSデータからは各小売店の販売状況を把握することができる。もちろん日本全国のPOSデータを収集することができれば日本全体の消費状況を把握することは可能であるが、相当のコストを要する。

このような特徴があるオルタナティブデータを利用する利点については、「既存データとの差別化」や「既存データとの補完性」、「速報性」といった点が挙げられる(図2)。トラディショナルデータだけでは得られない情報をオルタナティブデータによって補完することで他社や従前との差別化を図っていると考えられる。

【図2】オルタナティブデータ利用の利点(複数回答可、最大3つまで)

【図2】オルタナティブデータ利用の利点(複数回答可、最大3つまで)
(出典:一般社団法人オルタナティブデータ推進協議会「オルタナティブデータFACTBOOK(概要版)」
https://alternativedata.or.jp/wp-content/uploads/2023/11/JADAA_Factbook202311_outline.pdf)

活用事例

どのようなオルタナティブデータが活用されているのかというと、コロナ前から利用している層では「POSデータ」、「位置情報データ」、「ニュースデータ」などが多い。一方、コロナ後に利用を開始した層では「Webスクレイピング[3]データ」や「位置情報データ」、「ニュースデータ」が多く(図3)、今後も利用されるデータは変化していくものと推察される。

【図3】オルタナティブデータ利用開始時期と取扱うデータの種類(複数回答可)

【図3】オルタナティブデータ利用開始時期と取扱うデータの種類(複数回答可)
(出典:一般社団法人オルタナティブデータ推進協議会「オルタナティブデータFACTBOOK(概要版)」)

これらのデータが実際にどのように活用されているのかをいくつかの事例を挙げて紹介する。

<IoTデータ×マーケティング>

米国でスマート体温計を販売するKinsa Inc.は、その収集データから全米の発熱傾向を集計し、感染症の流行予測を行っている。例えば、コロナ禍では収集した体温データを分析したところ、あるエリアでは発熱傾向がピークになると、その2週間後に死亡者のピークが発生することが判明した。この分析結果は政府や自治体の感染症対策にも利用された。また、体温データを継続的に分析することで街レベルでの発熱動向が追跡可能になり、これらのデータはドラッグストアに向けて販売されている。ドラッグストアは、衛生用品の仕入れタイミングの判断や流行が高まりそうな街にマスクや薬の在庫を移動したりするのに活用している(図4)。

【図4】発熱のある人の割合(Kinsa体温予測データと実際)

【図4】発熱のある人の割合(Kinsa体温予測データと実際)
(出典:Kinsa Insights HP https://kinsainsights.com/)

<衛星画像×課題解決>

米SpaceKnow Inc.は、人工衛星が取得した衛星画像をAIで分析し、経済、エネルギー、防衛、環境などさまざまな領域でソリューションを提供している。例えば、ディズニーパークを追跡している衛星画像に基づいて、入園者用駐車場、従業員用駐車場、ホテル駐車場別の日次インデックスを提供しており、テーマパークの入園者数や業績を推測するのに利用している(図5)。

【図5】ディズニー従業員駐車場指数(Employee Parking Index)と収益

【図5】ディズニー従業員駐車場指数(Employee Parking Index)と収益
(出典:SpaceKnow HP https://spaceknow.com/blog/disneys-parks-in-florida-from-space/)

<Webスクレイピングデータ×営業効率化>

不動産会社向けに物件管理システムを販売している会社では、競合他社よりも先に新規開業したばかりの会社にアプローチしたいと考えるが、その際、事業規模がある程度大きくシステムを導入できる余力がある会社に限定したいといった要望があった。そこで、日本のエクスマートでは、Webスクレイピングによって複数の不動産ポータルサイトから不動産会社情報を継続的に収集し、前回収集した内容と比較することで、新規開業の会社情報をすぐに把握することができるようになるサービスを提供開始した。また、会社ごとの物件取扱数や会社の規模が分かる情報もあわせて収集することでサービス利用会社の営業効果の向上に役立っている(図6)。

【図6】Webスクレイピングによる不動産会社情報の収集

【図6】Webスクレイピングによる不動産会社情報の収集
(出典:株式会社エクスマート HP https://web-sc.exmart.co.jp/case/plan2/853/)

課題

このようにいろいろな場面でオルタナティブデータが活用されているものの、以下のような課題があるといわれている。

  • データの利用コストが高い(収集/購入コスト、分析コスト)
  • 費用対効果が分からない
  • データを活用できる人材が少ない
  • データ自体の代表性・正確性・信頼性への不安
  • 法規制やコンプライアンスへの不安

これらのことを踏まえると、まずはスモールスタートでデータの収集・分析を行い、有効性を確認した上で、次のステップに進むのが良いと考えられる。また、オルタナティブデータ特有の課題として、データ入手の継続性、適法性やコンプライアンスの順守といった事業での活用にあたってのリスクについても事前の確認が必要になる。

社会や業界全体として取り組むべき課題としては、各オルタナティブデータの関係性を明確にする仕組みづくりが挙げられる。現状、A社のデータで足りない部分があった場合、補完するためのデータは利用者がゼロから探す必要がある。もしA社のデータで足りない部分をB社やC社のデータで補完できることが容易に分かる仕組み(オルタナティブデータ検索サイト等)があれば、複数社のデータを組み合わせることによって精度の高い分析ができ、データの有用性も向上すると考えられる。

まとめ

データは企業の競争力を左右する重要な資産になっており[4]、その中でもオルタナティブデータへの注目が高まっている。今後もリアル・サイバー空間におけるデータは増えていくことが容易に想像され、さまざまなデータによってこれまでにない洞察を得られるようになると考えられる。データは過去や現在だけではなく、未来を見通す際にも活用することができ、できるだけ多くの明るい未来を見つけられるように期待したい。

 

[1] 2023年11月に公表された最新版における日本の順位は64カ国中32位となっている。

[2] 内閣府「月例経済報告等に関する関係閣僚会議資料」(2020年4月23日)https://www5.cao.go.jp/ keizai3/getsurei/2020/04kaigi.pdf

[3] Webサイトから特定の情報を自動的に抽出する技術のこと。

[4] 2025SNA(改訂予定の国民経済計算の新国際基準)でもデータの資本としての記録方法について検討が進められている。https://www.esri.cao.go.jp/jp/esri/workshop/forum/230725/pdf/230725_siryo02.pdf

※この記事は会員サービス「InfoCom T&S」より一部抜粋して公開しているものです。

当サイト内に掲載されたすべての内容について、無断転載、複製、複写、盗用を禁じます。InfoComニューズレターを他サイト等でご紹介いただく場合は、あらかじめ編集室へご連絡ください。また、引用される場合は必ず出所の明示をお願いいたします。

情報通信総合研究所は、先端ICTに関する豊富な知見と課題解決力を活かし、次世代に求められる価値を協創していきます。

調査研究、委託調査等に関するご相談やICRのサービスに関するご質問などお気軽にお問い合わせください。

ICTに関わる調査研究のご依頼はこちら

関連キーワード

鷲尾 哲の記事

関連記事

InfoCom T&S World Trend Report 年月別レポート一覧

メンバーズレター

会員限定レポートの閲覧や、InfoComニューズレターの最新のレポート等を受け取れます。

メンバーズ登録(無料)

各種サービスへの問い合わせ

ICTに関わる調査研究のご依頼 研究員への執筆・講演のご依頼 InfoCom T&S World Trend Report

情報通信サービスの専門誌の無料サンプル、お見積り

InfoCom T&S World Data Book

グローバルICT市場の総合データ集の紹介資料ダウンロード