ここ数年、センサーデータを使った分析への関心が高まっています。一方で、活用したいけれどデータ処理や分析の仕方がわからない、そもそも取得すべきデータがわからないという声も聞かれます。
メディアやセミナーではこれらの疑問に応えるべく、センサーデータの活用方法や事例などが盛んに取り上げられていますが、「センサーデータの質」についてはあまり語られていないようです。
 
分析はデータの質に左右されますが、センサーデータは質の担保に難しさがあります。機械の稼働停止や特殊な環境によってデータの欠損や異常値が混在しやすいためです。
 
本コラムではセンサーデータ活用の前提となる「センサーデータの質」という考え方をご紹介します。
 
 
センサーデータの取得環境
センサーの種類は加速度センサーや味覚センサーなど幅広いですが、いずれのセンサーデータも取得環境によって2つに分けられます。
 
1つは、リアルな物理現象のデータです。運用中の機械や工場などに取り付けられたセンサーによる物理現象の実態を把握したデータのことです。
もう1つは、リアルな物理現象を再現したデータです。性能試験や負荷実験などで得られたデータがこれに相当します。
 
リアルな物理現象のデータであれば、データクレンジング、データ加工…という手順で分析に進むことができます。一方、リアルな物理現象を再現したデータは分析に値するデータかどうかを見極める必要があります。
 
 
本当にリアルを再現したデータなのか?
故障予測などは通常、実際のデータを分析して作った予測モデルと新たに蓄積されていくデータとのギャップで異常の検知を行います。このため、リアルな物理現象を再現したデータの場合、実験が成功していることが分析の条件となります。
 
なぜなら、本来はリアルなデータで分析するところ、データがないためにやむを得ず再現データを使うわけですから、実際に近い結果が出ていないと誤った判断を導きかねません。ちなみに実験の成功とは、「故障時はこのような現象が発生するだろう」などの仮説どおりの現象が確認されることを指します。
 
実験や試験以外でも、センサーデータはwebログやアンケートに比べて質の担保が難しい傾向にあります。分析して運営に活かしたいならば、まずはセンサーデータの質を高めることが重要です。
 
 
分析に値するデータ
センサーデータの質を上げるにはどうしたらよいのでしょうか。策として、以下が考えられます。
 
  • 現実を再現したデータを得られない実験計画を改善
  • 負荷のかけ方や環境などを調整してリアルを再現できるようにする
  • データが少ないデータ欠損を防ぐ措置を講じる
  • 通信環境や運用環境を改善するなど長期的にデータを取れるようにする
 
センサーデータの質が向上すれば、実際の現象を見られないケースであっても、再現データから予測モデルを組むことができるようになります。センサーデータはリアル再現の組み合わせ次第で活用の幅が広がる可能性を秘めているのです。
この記事を書いた人
大竹 由美
Otake Yumi

データアナリティクス部 戦略分析グループ リード・アナリティクスディレクター

調査会社で海外の文献調査に従事後、株式会社アイスタイル(@cosme運営)で、ログ分析に基づくウェブサイトのディレクションを担当。
シンクタンク、コンサルティング会社にて生活者アンケートをメインとする調査業務に携わったのち、ウフルに参画。ウフルでは、リード・アナリティクスディレクターとしてプロジェクトに参加。

Contact

ご依頼ご相談など、
お問い合わせは下記フォームから
お願いいたします。