最近ではすっかり馴染みになってきている「AI」。AIを導入し、自動化が実現することで効率的に業務を行うことができると期待を持っている方も多いでしょう。しかし、効率的になるからという理由だけでAIによる自動分析を決めようとしていませんか?
その前に抑えなくてはならないポイントがあります。それは分析に利用する『データ』です。
 
 

AIを用いた分析プロセス

AIによる自動分析の前に、まずは分析のプロセスを整理しておきましょう。
 
タブレット
 
タブレット
 
①データ
生データは、取得した状態のデータを指します。
今回はわかりやすい例として購買データを挙げます。購買データと顧客データのようにデータテーブルが分かれていることがあります。この他にもデータの単位が異なっていたり文字列が混ざっていたりデータの状態は様々です。その場合、そのまま分析を行うことができないためデータを前処理・加工する必要があります。
 
②input
目的に合わせて機械学習モデル(これがいわゆるAI)を検討し生データの中から、必要なデータを抽出・加工します。モデルを検討する場合には『目的変数』の有無、『ホワイトボックス/ブラックボックス』『できること』を整理します。ここでは簡単に説明します。
 
『目的変数』・・・データには説明変数と目的変数があります。目的変数とは分析によって明らかにしたい事柄を数値化したものです。機械学習モデルに当てはめると、入力されたパラメータに応じてその値が変化します。このように目的変数に影響を与える要素を「説明変数」といいます。
『ホワイトボックス/ブラックボックス』・・・ホワイトボックスとは、アルゴリズムの仕組みを人が理解・説明できるモデルです。反対にブラックボックスは、出力結果に至るプロセスを人が理解・説明できないモデルを指します。
『できること』・・・機械学習で行うことのできる分析は、大きく分けて予測・説明・分類・パターン抽出の四種類です。
 
目的と分析モデルを整理すると、以下のようになります。
タブレット
 
③機械学習
加工したデータを使用し選択した機械学習を行います。目的に応じた機械学習の選択が必要で、この見極めが重要です(多変量解析のうち、重回帰かロジスティック回帰か?教師ありか教師なしか?など…)。
機械学習はpythonやRを利用し自動化を想定した組み込み処理をして実行します。
 
④output
機械学習の結果を出力します。目的変数がある場合には、実際の結果と照らし合わせて精度を高めていくことが可能です。
 
この流れを繰り返すことでAIによる分析プロセスをブラッシュアップさせていくことができます。
 
 

機械学習データの懸念点

しかし、あらゆるケースにAIによる自動分析が適しているわけではありません。機械学習に向いていないデータもあるのです。
弊社が依頼された事例でも、AIを使用して業務プロセスを最適化したいという要望がありましたが、検討を始めた際に問題が二点浮かび上がりました。
 
●データ量が少ない
機械学習のデータセットを作成する場合、レコード数がカラム数(パラメータ数)の10倍あることが理想とされています。しかし。前述のケースでは、カラム数は多いものの、レコード数が少なかったので、精度の高い機械学習モデルにはなりませんでした。
 
●データ蓄積のスピードが遅い
データの量について先ほど指摘しましたが、最初は少なくても、月毎に何千件レベルでのデータ蓄積が期待される場合には、データが追加される度に機械学習することで精度が上がっていきます。しかし月に数十件ずつしかデータが蓄積されない場合は精度の高い機械学習ができるまでに年数がかかってしまうため機械学習に適しているとは言えません。
 
 

まとめ

以上を踏まえ、AIによる自動分析検討する前に自社の持つデータと分析によって明らかにしたい課題を整理する必要があります。しかし、データがAIを使った分析や自動化に適しているかどうかを判断するのは難しいです。私たちData AnalyticsではAI導入の判断から構築までサポートすることが可能です。気になることがありましたらお気軽にご相談ください。
この記事を書いた人
倉橋 いずみ
Izumi Kurahashi

データアナリティクス部 アシスタント・アナリティクスディレクター

ウフルに新卒入社。1年目から複数のプロジェクトに参画し、主にデータの加工・分析を担当。

Contact

ご依頼ご相談など、
お問い合わせは下記フォームから
お願いいたします。