現場ドリブン

オペレーションを進化させる
現場のWEBマガジンpowered by Bewith
今日からはじめるコンタクトセンターExcel統計解析 ~第三歩目~
  • #統計学
  • #コンタクトセンター
  • #コールセンター

DIGITAL

nabe

2023.09.06

「今日からはじめるコンタクトセンターExcel統計解析」として、前回前々回はデータの全体像を以下に把握するかのお話をしました。

今回は応用編として、未来予測やシミュレーション、要因分析などにも使える、「回帰分析」についてお話ししていきます。

「気温」から「アイスクリームの売上」を予測する

ある「A」という数値の変化に対して、「B」という数値がどのように変化するかを予測したい、ということがあります。こういう時に使えるのが回帰分析です。今回は、”回帰分析”と調べたときに、よく出てくる「アイスクリームの売上」予測についての例を元に回帰分析の手順を紹介します。

ここでは以下の5年間(2016年1月~2020年12月)の月の平均気温とある店舗の月の売上高のデータで、回帰分析を使って、「気温」から「アイスクリームの売上」を予測する式を作ってみましょう。
この場合、ある数値Aが「気温」で、数値Bが「アイスクリームの売上高」です。




01.散布図を描く

前々回の「エクセルでの統計解析 ~第一歩目~」のお話しの通り、まずはデータの全体像を把握するため散布図を描いてみます。
回帰分析をしたい場合には、横軸に予測に使う数値を、縦軸に予測する数値をプロットする(データを当て込む)とわかりやすいです。


散布図を見ると、「気温」が上がるごとに「売上高」が上がっていることが分かります。


02.相関係数を算出する
散布図を見て、「気温」が上がるごとに「売上高」が上がることが分かったので、どれくらい関係が強いのかを数値化するために相関係数を算出します。
相関係数は「‐1~1」の間の数値を取り、‐1に近ければ近いほど強い負の相関、1に近ければ近いほど強い正の相関があると言えます。以下は相関係数と相関の強さの目安です。


Excelの場合、CORREL関数を使うと簡単に算出でき、「相関係数:0.91」と非常に強い相関関係にあることが分かります。


03.回帰分析をする
**************
回帰分析とは、1つの目的変数(予測したい値)と複数の説明変数(目的変数に影響を与える要素)を用いて、それらの関係を数学的にモデル化する手法のことを言います。
「説明変数」が1つの場合を「単回帰分析」、複数の場合を「重回帰分析」といいます。

数学的にモデル化するとは以下の『回帰式』(もしくは、回帰方程式)を求めることを言います。

回帰式は、yを目的変数、x(もしくはxi)を説明変数としたときに以下で表されます。


この時、a(もしくはai)を係数、bを切片と言います。
**************

今回の「気温」から「売上高」を予測するため、「気温」が説明変数、「売上高」が目的変数であり、説明変数が1つなので単回帰分析を行うことになります。
Excelの場合、数学的にモデル化する『回帰式』を算出するのは簡単で、


①散布図を一度クリックしたあと、グラフの右上に表示されている「グラフ要素の追加」アイコンをクリック
②散布図に追加するグラフ要素を選択する画面が表示されるので「近似曲線」の右の「?」の中の「その他のオプション」をクリック
③近似曲線のオプション内の『グラフに数式を表示する』にチェックを入れる
という流れで回帰式を散布図内に出力することができます。

今回出てきたのは、

y = 117490x + 63028

という方程式です。

これによって、月の平均気温(予測)が○℃の時の、売上高の予測ができるようになります。
この方程式は、yが「売上高」、xが「気温」を表しています。書き換えると

「売上高」 = 117,490×「気温」 + 63,028

となり、「気温」が1度上がるごとに「売上高」が117,490円上がることを表しています。


04.回帰分析の詳細を確認する
さて、回帰分析はここで終わりではありません。この式が意味あるものなのかを、統計的に確認する必要があります。
詳細を出すために、エクセルの「データ分析」を使います。
※上記のデータタブに「データ分析」がない場合は以下のサイト参考にして、有効にしてください
なるほど統計学園 データ分析」の設定方法


【手順】
①「データタブ」から「データ分析」ボタンを押下し、「回帰分析」を選択
②入力Y範囲に目的変数である「売上高」の範囲を選択
③入力X範囲に説明変数である「気温」の範囲を選択
 ∟それぞれの範囲でラベルを含んでいる場合は、「ラベル」にチェックを入れる
④②③の設定ができたら、OKボタンを押すと以下の詳細な回帰分析の結果を出力できます。


最低限押さえておきたい数値に色を付けています。

【オレンジ色の数値】


オレンジ色の数値は確率を表しています。また単回帰分析の場合、同じ値です。
ただ意味合いはそれぞれ違います。

・有意 F
意味のある回帰式が得られたかどうかを評価している値です。
あくまでも目安としてですが、有意Fが0.05または0.01未満であれば、有用な回帰式を得られた可能性が大きいと判断できます。

・P-値
説明変数が目的変数に対して関係があるかどうかを表す指標です。
こちらも「有意 F」と同様に、あくまでも目安としてですが、0.05または0.01未満であれば、説明変数は目的変数に対して「関係性がありそう」と判断できます。

以上のことから、『有意F』と『P-値』は
3.2474E-24 = 3.2474×10^-23 ( 3.2474×10を「-23乗」のことなので、限りなく小さい数になる)と0.05または0.01よりも十分小さいため、意味ある回帰式が得られており、月の平均気温は売上高と関係がありそうだと判断できます。
もしこれらの値が、0.05以上の場合は、意味のない回帰式であり、説明変数と目的変数には「関係性がなさそう」となるため、予測には適さないという結論になります。


【緑色の数値】


・重相関 R
重相関係数と呼ばれるものです。
単回帰分析の場合、説明変数と目的変数の相関係数を表しています。

・重決定 R
決定係数、もしくは寄与率と呼ばれるものです。
回帰分析で得られた回帰式が目的変数の値変動をどの程度説明できているかを表す指標です。
0~1の値を取り、1に近ければ近いほどよく説明できていると解釈できます。

・係数
回帰式を算出するための数値です。
先ほどの散布図の「気温」にかける数値が下側、そのあとに足している数値が上側の値です。


以上のことから、今回の回帰分析で出力した回帰式

y = 117490x + 63028 (「売上高」 = 117,490×「気温」 + 63,028)

は、「意味のある式であり、重決定 R(決定係数)が0.82と1に近く、説明変数「気温」が目的変数「売上高」をよく説明できている」
と結論付けることができます。


■回帰分析の際の注意点
説明変数と目的変数の関係性を何の下調べもなく、回帰分析を始めてしまうと、意味のない回帰式が出てくる可能性が高いです。
そのためにも、回帰分析の準備として、散布図や相関係数を出力して、説明変数と目的変数の関係がありそうかどうかを確認することをお勧めします。

多種多様なコールセンターを運営するビーウィズが、これまでの運営ノウハウを集約し、通信販売事業成長のポイントや顧客に対する効果的な施策などをご紹介いたします。

詳しい資料は、以下よりダウンロードいただけます。
https://www.bewith.net/gemba-driven/download/entry-308.html

その他関連サービス

■クライアント企業に合わせた、最適運用を実現
コールセンター・コンタクトセンター

■クライアント企業のマーケティング活動を最適化
アウトバウンド

■お客様のニーズに寄り添い、お客様に合わせたミライを提供
インバウンド


関連記事