前回 前々回と、普通じゃない統計「ベイズ統計」についてお話をしてきましたが、今回は普通の統計についてお話をしていきます。
特にエクセルを使った統計解析の“第一歩目”のお話が出来ればと思います。
==
データ分析をしようと思った時に、まず取り出すのがエクセルだと思います。
デスクトップアプリなので、環境を選ばず、統計解析に使えるさまざまな関数が備わっているためだと思います。
統計解析というと少し難しそうに聞こえてしまいますが、「平均」「最大値」「最小値」をデータから取るというのも統計解析の1つです。
今回はそこから半歩くらい踏み込んだ、私がコールセンターの管理者の時にやっていたエクセルを使った統計解析と、細かいけど覚えておいて損はない話をご紹介できればと思います。
データの全体像を把握する
データ分析を始めるとき一番はじめにするのは、「対象データの全体像を把握すること」です。
「平均値」などのデータの分布の特徴を表す値を出すことでもある程度は全体像を把握できますが、おすすめは『可視化』をすることです。
ではなぜ、『可視化』をしないと全体像が掴みづらいのか、例を次に挙げてみます。
○平均は同じだけど・・・
(例.1)テストの結果
以下は、ある10名の数学・国語・英語のテストの結果です。
表に記載の通り、3教科の平均点は同じです。じゃあ、どの教科も同じようなデータの傾向かというと、そういうわけではありません。
実際、各教科の個別のデータを見てみると、
数学:いろんな値を取っている
国語:平均点付近にまとまっている
英語:100点か30点しかない
ことがわかると思います。
このように、同じ平均点でもデータのばらつき具合が違う場合は、平均を確認するだけでは「対象データの全体像を把握すること」ができません。
また、この例だと10名分の結果なので、各教科の個別にデータを見れば全体像を把握できますが、100名や1,000名と多くなればなるほど、それが出来なくなります。
そこで役立つのが『可視化』です。
・ヒストグラムによる可視化
度数分布表とはデータをある幅ごとに区切ってその中に含まれるデータの個数を表にまとめたもので、
ヒストグラムは度数分布表を使いデータの分布の様子を見るのに用いるグラフのことです。
3教科のテストの結果を度数分布とヒストグラムにすると以下のようになります。
どうでしょうか。データを眺めるだけよりも、それぞれの教科の全体像が把握しやすくなったのではないでしょうか。
(例.2)応対品質評価
さて、(例.1)は1教科当たりのデータ数が10名だったので、可視化による効果がわかりにくかったかもしれません。そのため、次は応対品質評価を例に、100名の例を扱ってみます。
同じ業務のコールセンターA拠点・B拠点のある月の応対品質評価の一覧表が以下の通りです。
それぞれ平均点を出してみたところ、「A拠点:74.56点」「B拠点:74.53点」とほぼほぼ同じでした。
ざっとデータを眺めていると、それぞれの拠点の傾向は違いそうに見えます。
A拠点:60~70点台が多い?
B拠点:高得点もいるが、低得点もいる?
平均点が同じくらいでも全体像は違いそう、ということで(例.1)に倣って、度数分布表とヒストグラムを作ると次のようになります。
この度数分布表とヒストグラムを見ると、
A拠点:平均点付近の71~80点が多い(全体の68%)
B拠点:81~90点の高得点層も多いが、51~60点の低得点層も同じくらい多い
という傾向が見えてきました。
ただ、10点の幅だと一つの区切りのデータ数が多いところがあるので、得点の幅を5点に狭めて度数分布表とヒストグラムを作ると、次のようになります。
この度数分布表とヒストグラムを見ると、
A拠点:平均点付近の76~80点が1番多く、71~75点が2番目に多い。
また、データのばらつきが小さい
B拠点:86~90点の高得点層も多いが、56~60点の低得点層も同じくらい多い。
また、データばらつきが大きい
というより詳しい傾向が見えました。
今回の2つの例は、分かりやすさを重視するために極端な例を扱いましたが、特にデータ数が多いときには、個別のデータをざっと見て平均値だけを取ってなんとなく傾向を把握するのではなく、度数分布表を作りヒストグラムで可視化をすることでその傾向をしっかりと把握し、全体像を掴むようにするとデータからの課題発見につながりやすくなると思います。
平均について
さて、ここからは平均についての細かいけど覚えておいて損はない話を2つ、Tips的にお話ししてみようと思います。
○平均の平均を取らない
これは皆さんも聞いたことのある話かもしれませんが、コールセンターの現場でもよく見かけました。
ここでは、コールセンターの平均処理時間での例を挙げ、何が問題かを簡単に説明します。
次の表はあるコールセンターの1ヶ月の各個人の対応件数、総処理時間(秒)からAHTを算出した表です。
ここで言いたいのは、この表の「AHT」列の平均を取って、センター全体の「AHT」としてはダメということです。
正しいセンター全体の「AHT」は
(センター全体の「AHT」)=(全員の総処理時間(秒)の合計)÷(全員の対応件数の合計)
で求められます。
この表の内容でそれぞれを計算すると、
「AHT」列の平均 :678.67秒
センター全体の「AHT」 :679.76秒
と「AHT」列の平均の方が約1秒短くなります。
これは、各個人の対応件数が違うために出てくる違いです。
「1秒程度であれば問題ないんじゃない?」と思う方もいるかもしれませんが、『センター全体の「AHT」』だと思って、『「AHT」列の平均』を使って稼働計画を立てている場合には、微妙な誤差が生まれてきてしまします。
初めは微妙な誤差だったものが、積み重なっていくうちに取り返しのつかないことにもなりかねません。
たかが1秒、されど1秒なのです。
○いろいろな平均
普段私たちが使っている「平均」は統計の世界では「算術平均」と呼ばれています。
実はそれ以外にも「平均」と呼ばれるものがあり、仕事でも使えるかもしれないものをご紹介します。
・幾何平均
データが「比率」である場合、算術平均でなくこの幾何平均を使います。
(例)
あるコールセンターの入電数が、昨年度は10,000件から15,000件の1.5倍に、今年度は15,000件から30,000件の2倍になった。この2年間で平均何倍になったか。
単純に算術平均をすると、(1.5+2)÷ 2 = 1.75倍 となります。
ただ、はじめの10,000件に1.75を2回かけると、
10,000 × 1.75 × 1.75 = 30,625 となり計算が合いません。
ここで使うのが、幾何平均です。
エクセルでは関数「GEOMEAN」を使うことで、幾何平均を求めることができます。
実際に計算してみると
おおよそ1.732倍となります。
(10,000 × 1.732 × 1.732 ≒ 29,998)
このような入電数の変化をするコールセンターはないと思いますが、
現実的に使われているのは『投資商品の平均利回り』や『企業の売上高の平均成長率』だったりします。
==
さて今回は、エクセルでの統計解析の初めの第一歩、「データの全体像を把握する」ことと「平均」についてお話をしていきました。
繰り返しにはなりますが、『全体像を掴むようにするとデータからの課題発見につながりやすくなる』と思います。
まずは第一歩からはじめてみましょう!
~~
参考サイト
(統計Web)https://bellcurve.jp/statistics/
ビーウィズが提供するオンライン接客/電子契約システム「UnisonConnect(ユニゾンコネクト)」は、商談・本人確認・申込・電子契約までをオールインワンで可能にする日本初のソリューションです。
対面接客での安心感はそのままに、対面で行っていたさまざまな業務をオンライン化できます。
オンライン上で担当者がお客様のお申込内容を確認しながら手続きが可能となり、書類不備などの手戻りをゼロに。
また、これまでは店舗や拠点ごとに必要であった、有資格者による説明が必要な業務も、全国のお客様に対応が可能となります。
UnisonConnectに関する詳しい資料は、こちらからダウンロードいただけます。
その他関連サービス
■クライアント企業に合わせた、最適運用を実現
コールセンター・コンタクトセンター
■クライアント企業のマーケティング活動を最適化
アウトバウンド
■お客様のニーズに寄り添い、お客様に合わせたミライを提供
インバウンド