現場ドリブン

オペレーションを進化させる
現場のWEBマガジンpowered by Bewith
今日からはじめるコンタクトセンターExcel統計解析 ~第四歩目~
  • #統計学
  • #Excel
  • #コンタクトセンター
  • #コールセンター

DIGITAL

nabe

2023.12.05

「今日からはじめるコンタクトセンターExcel統計解析」として、前回は単回帰分析のお話をしました。
今回は、「説明変数」が複数の場合の「重回帰分析」についてお話ししていきます。

■単回帰分析と重回帰分析

前回は、「気温」から「アイスクリームの売上」を予測する回帰分析をエクセルの「分析ツール」を使って解説をしました。
前回の記事の中でも触れましたが、” 「気温」から「アイスクリームの売上」を予測する回帰分析”は1つの目的変数(予測したい値)と1つの説明変数(目的変数に影響を与える要素)を用いて、それらの関係を数学的にモデル化したものだったため、回帰分析の中でも特に『単回帰分析』と呼ばれます。


今回お話しする『重回帰分析』は、1つの目的変数(予測したい値)と複数の説明変数(目的変数に影響を与える要素)を用いて、それらの関係を数学的にモデル化する手法のことです。
具体的にどのようにエクセルで分析するのかを、前回同様に、「アイスクリームの売上」を目的変数にして、以下のデータ使って、説明していきます。

■気温と湿度からアイスクリームの売上を予測する

以下は5年間(2016年1月~2020年12月)の月の平均気温・平均湿度、ある店舗の月ごとのアイスクリームの売上高のデータです。
「月の平均気温・平均湿度」を説明変数、「アイスクリームの売上」を目的変数として、重回帰分析を行っていきます。



01.散布図を描く

前回同様にまずは散布図を描きますが、前回と違って説明変数が2つあるため、「月平均気温と月の売上高」「月平均湿度と月の売上高」と『説明変数ー目的変数』のそれぞれのペアで散布図を描きます。



散布図を確認すると、
「平均気温」が上がるごとに「売上高」が上がっていること
「平均湿度」が上がるごとに「売上高」が上がっていること
が分かります。


02.相関係数を算出する
散布図を見て、「平均気温」・「平均湿度」が上がるごとに「売上高」が上がることが分かったので、どれくらい関係が強いのかを数値化するために相関係数を算出します。(前回と同様にエクセルのCORREL関数を利用)


「平均気温」と「売上高」の相関係数は0.91
「平均湿度」と「売上高」の相関係数は0.75
どちらも強い正の相関があることがわかりました。


03.重回帰分析をする
さて、いよいよ重回帰分析をしますが、重回帰分析の回帰式は前回のように求めることはできません。

********************************************
(前回の回帰式の導出)


①散布図を一度クリックしたあと、グラフの右上に表示されている「グラフ要素の追加」アイコンをクリック
②散布図に追加するグラフ要素を選択する画面が表示されるので「近似曲線」の右の「?」の中の「その他のオプション」をクリック
③近似曲線のオプション内の『グラフに数式を表示する』にチェックを入れる
********************************************

というのも、今回は説明数が2つあるため、グラフ表現は頑張ればできますがそこに近似曲線を描くことができないためです。
そのため、前回の「04.回帰分析の詳細を確認する」で行った、エクセルの「分析ツール」を使った手法で重回帰分析を行っていきます。


04.「分析ツール」を使った重回帰分析
※データタブに「データ分析」がない場合は以下のサイト参考にして、有効にしてください
▶「なるほど統計学園 データ分析」の設定方法

【手順】
①「データタブ」から「データ分析」ボタンを押下し、「回帰分析」を選択


②入力Y範囲に目的変数である「売上高」の範囲を選択


③入力X範囲に説明変数である「平均気温」「平均湿度」の範囲を選択
 ∟それぞれの範囲でラベルを含んでいる場合は、「ラベル」にチェックを入れる


④②③の設定ができたら、OKボタンを押すと以下の詳細な回帰分析の結果を出力できます。
※前回同様、最低限押さえておきたい数値に色を付けています。
 



【オレンジ色の数値】有意F、P-値

有意水準を0.05とした場合は、オレンジ色の数値すべてが0.05未満(有意F:2.67E-23 = 2.67×10^-23 = 2.67×(10の-23乗)、「月平均気温」のP-値:9.48044E-14 = 9.48044×10^-14 = 9.48044×(10の-14乗))のため、意味のある回帰式が得られており、「月平均気温」・「月平均湿度」は売上高と関係がありそうだと判断できます。
(※今回の場合、より厳密に有意水準を0.01とした場合は、「月平均湿度」は売上高に関係なさそうと判断されます。簡単のため、以下は有意水準を0.05とした場合として話を進めます。)

【緑色の数値】重決定 R(決定係数、もしくは寄与率)
・重決定 R(決定係数、もしくは寄与率)は回帰分析で得られた回帰式が目的変数の値変動をどの程度説明できているかを表す指標です。0~1の値を取り、1に近ければ近いほどよく説明できていると解釈できます。
今回の場合、0.82と1に近く、説明変数「月平均気温」・「月平均湿度」が目的変数「売上高」をよく説明できています。

【青色の数値】回帰式の係数
・係数は回帰式を算出するための数値です。
「月平均気温」にかける数値が真ん中、「月平均湿度」にかける数値が下側、そのあとに足している数値が上側の値です。

以上のことから回帰式は
「売上高」 = 154,790×「月平均気温」 -32,088×「月平均湿度」+ 1,677,926
と表すことができ、(有意水準0.05の場合)意味のある式であり、重決定 R(決定係数)が0.82と1に近く、説明変数「月平均気温」・「月平均湿度」が目的変数「売上高」をよく説明できている

と結論付けることができます。

この式を使うと、気温25℃湿度80%の場合、予想「売上高」は
「売上高」= 154,790×25 -32,088×80 + 1,677,926
= 3,869,750   -2,567,040  + 1,677,926
= 2,980,636
と予想することができます。

■重回帰分析の注意点

・多重共線性(説明変数同士の相関関係の強さ)
説明変数同士が強い相関を持っている場合、多重共線性が生じる可能性があります。
もしそれらを説明変数に加えてしまうと、分析結果が不安定になり正しい結果が得られないという問題が生じます。この現象のことを”多重共線性が生じている”と言います。
そのため、「02.相関係数を算出する」では、『説明変数―目的変数』の相関係数だけでなく、説明変数同士の相関係数も確認し、「0.9以上」の場合には、どちらかの説明変数をなくすか、新たな変数を作ることをおすすめします。

・説明変数の数
説明変数が多すぎてはいけません。説明変数の数が多すぎると、過学習というものを起こしてしまいます。
過学習を起こすと、予測が正確にできなくなってしまいます。
説明変数の数は、おおよそ『(データの数)÷15』までに抑えることが推奨されています。

・エクセルでの回帰分析は分析の入り口
回帰分析はエクセルで手軽にできて、既に使っている方もいると思いますが、手軽さゆえに強い仮定の“線形性”の上で成り立っています。
“線形性”とは説明変数が上がり続ければ、目的変数も直線的に増加または減少し続けることです。たとえば一定の値までは増加するが、その値を超えると減少するような説明変数や、2次関数や指数関数的に目的変数が増加していくような説明変数は通常の回帰分析で対応できません。
そのため、まずは説明変数と目的変数の散布図を描いて、関係性を図示することをおすすめします。そして、”線形性”が確認できないのであれば、専門家に相談することも強くおすすめします。

ビーウィズが提供するオンライン接客/電子契約システム「UnisonConnect(ユニゾンコネクト)」は、商談・本人確認・申込・電子契約までをオールインワンで可能にする日本初のソリューションです。

対面接客での安心感はそのままに、対面で行っていたさまざまな業務をオンライン化できます。
オンライン上で担当者がお客様のお申込内容を確認しながら手続きが可能となり、書類不備などの手戻りをゼロに。
また、これまでは店舗や拠点ごとに必要であった、有資格者による説明が必要な業務も、全国のお客様に対応が可能となります。

UnisonConnectに関する詳しい資料は、【こちら】からダウンロードいただけます。


その他関連サービス

■クライアント企業に合わせた、最適運用を実現
コールセンター・コンタクトセンター

■クライアント企業のマーケティング活動を最適化
アウトバウンド

■お客様のニーズに寄り添い、お客様に合わせたミライを提供
インバウンド


関連記事