今日からはじめるコンタクトセンターExcel統計解析　～第二歩目～

#コンタクトセンター
#統計学

DIGITAL

nabe

2023.06.14

前回は、『今日からはじめるコンタクトセンターExcel統計解析　～第一歩目～』と題して「データの全体像を把握する」ための"度数分布表"と"ヒストグラム"のお話をしました。

今回は統計解析の“第二歩目”として、"標準偏差"と"偏差値"のお話が出来ればと思います。

前回のおさらいと導入

前回は次のデータの全体像を把握するために、度数分布表とヒストグラムの作り方をお話しました。
　

コールセンターA拠点・B拠点のある月の応対品質評価の一覧表

A拠点・B拠点それぞれの度数分布とヒストグラム

この度数分布表とヒストグラムを見ると、
A拠点：平均点付近の76～80点が１番多く、71～75点が２番目に多い
また、データのばらつきが小さい
B拠点：86～90点の高得点層も多いが、56～60点の低得点層も同じくらい多い
また、データばらつきが大きい
という傾向が見えます。

A拠点とB拠点で、平均値はほぼ同じですが、データのばらつきが違うことは分かりますが、具体的にどれくらい違うでしょうか。
それを数値で表すことができるのが、『標準偏差』です。

標準偏差～データのばらつきを数値で把握する～

標準偏差とは平均値を基準にして、各データがどれくらい散らばっているかを表す指標のことです。
また、扱いとしては平均値と同じ、基本統計量と呼ばれるデータの特徴を表す数値で、sの記号で表されることが多いです。

数式としては標準偏差をs、各データの値をx_i、平均値をx ̅、データの数をnとして次のように定義されています。

Excelでは「STDEV.P」という関数が用意されているので、その関数を使えば平均値と同じように簡単に求めることができます。
（※Excel関数「STDEV.S」との違いは最後の方に簡単な解説を載せています）

上の画像の通り、A拠点とB拠点では平均点はほぼ同じでしたが、標準偏差はA拠点が4.88、B拠点が13.56とB拠点の方が大きく、ばらつきが大きいことが数値として把握することができるようになりました。
ばらつきが大きいとはどういうことかというのは、以下のように範囲で表すとわかりやすいです。

A拠点：74.56±4.88 ＝　69.68～79.44点
B拠点：74.53±13.56 ＝　60.97～88.09点

これは平均点から標準偏差を引いた数値と足した数値の範囲です。
A拠点に比べて、B拠点の方が標準偏差が大きいたため、広い範囲を取っています。

また、この範囲の中に多くのスコアが入る性質を持っていて、ばらつきが小さいほど多くのスコアが入ります。
具体的には、それぞれの範囲にA拠点は72名、B拠点は46名が入っています。

データの全体像を把握して、目標を設定する

前回と今回のここまでで、データの全体像を把握するための統計解析ツールはある程度揃いました。
それを具体的にどう使っていくのかを、以下の例を挙げてまとめていきます。

あなたは、これまで例として挙げてきたB拠点の新任応対品質担当者です。
B拠点ではA拠点に比べてお客様からのお叱りを受けることが多いことが課題です。
それぞれの拠点の応対品質スコアから何か発見が出来ないかを探ります。

①平均を取る

全体的にスコアが悪いのかと思い、それぞれ100名の平均を取ってみましたが、あまり変わりはありませんでした。

②度数分布表とヒストグラムを作って全体像を把握する

次に、全体的なスコア傾向を把握するために、度数分布表とヒストグラムを作ってみました。
その結果、A拠点は平均付近に多くの度数があるのに対して、B拠点は平均点付近にはあまり度数がなく、更には65点以下の人が4割も居ることがわかりました。
また、お客様からお叱りを受けている人はスコアが低い人が多いことも調べて分かりました。

この結果から、B拠点では応対品質の底上げが必要だと判断することになりました。

③ばらつきを数値として取得して、数値から課題を発見できるようになっていこう
今回の例だと、標準偏差を取得しなくても、前回の「第一歩目」の内容でデータから問題点を発見することができました。
それでは、逆に度数分布やヒストグラムを使わずに同じような問題の発見に至れるかを以下に説明します。

・平均と標準偏差を取得

「平均は同じくらいだが、A拠点と比べてB拠点は標準偏差が大きい。」
「スコアが高い人もいるが、低い人も多そうだ。」

・「平均±標準偏差」の範囲を取得
A拠点：74.56±4.88 ＝　69.68～79.44点
B拠点：74.53±13.56 ＝　60.97～88.09点

「B拠点はスコアの低い人も多そうなので、この範囲よりも下のスコアの人がどれくらいいるかを調べてみよう。」
「60.97点未満が『35名』もいる。」
「35名の中にはお客様からお叱りを受ける方が多いようなので、応対品質スコアの底上げが必要そうだ。」

このような感じで、「平均＋度数分布＋ヒストグラム」でも「平均＋標準偏差」でも同じような問題の発見に至ることができます。
初めのうちは、まずは可視化をして、目で見て分かる形にして、併せて標準偏差も取ることで、『このくらいのばらつきだとこれくらいの標準偏差』という経験値を積んでいきましょう。
経験を積んでいくうちに、数値からだけでも問題発見が出来るようになっていくことができるようになるはずです。

偏差値を使って、尺度の違うデータを比較する

ここまでで、1つのデータ群の「度数分布表」「ヒストグラム」「平均」「標準偏差」を使い、データの全体像を把握することができるようになりました。
ここからは少し応用編に入り、2つの尺度が違うデータ群の比較を『偏差値』を使って、見ていきましょう。

・偏差値とは
偏差値と聞くと、学生時代のテストをイメージする方も多いのではないでしょうか。

偏差値とは、テストの点数の場合、

「(個人の点数－平均点)÷ 標準偏差 × 10 ＋ 50」

という式で計算できます。
"(個人の点数－平均点)÷ 標準偏差"この部分で『標準化』という計算を行っており、
これによって教科が違っても偏差値の大小を比べることができるようになっています。

このことを使って、次のデータの偏差値を求めて、誰のどの項目が、最も良い成績なのかを確認します。

・CPHと応対品質スコアの偏差値
次のデータは、C拠点100人のCPH（Call Per Hour：1時間あたりの対応件数）と応対品質スコアの一覧と、それぞれの平均と標準偏差です。

濃い緑で塗っているのは、それぞれの項目で一番成績が良い数値です。
この成績はどちらの方が良いのかを知るのに、また、総合的に誰が一番成績が良いのかを知るのに偏差値が役立ちます。

偏差値の計算は
CPHであれば
「(個人のCPH － CPHの平均)÷ CPHの標準偏差 × 10 ＋ 50」
応対品質スコアであれば
「(個人の応対品質スコア－応対品質スコアの平均)÷ 応対品質スコアの標準偏差 × 10 ＋ 50」
をExcelに数式入力すれば計算できます。

また、総合的に最も良い成績なのかを知るために2つの偏差値で平均を取ります。
計算した結果は以下の通りです。

この結果から、項目間で比較した場合は「応対品質スコア：94点（偏差値：69.43）」が一番成績が良く、総合的に一番成績が良いのは「C0077さんで平均偏差値：62.89」という結果が得られました。

このように、そのままでは比較が難しい尺度が違うデータ群を、偏差値を使うことで比較できるようになりました。

Excel関数「STDEV.P」と「STDEV.S」の違い

この2つの関数は、どちらとも”標準偏差”を求めることができると思っているかもしれませんが、厳密にいうと、違うものが計算されています。

・「STDEV.P」・・・母集団標準偏差
本来知りたいと思っている集団全体のことを「母集団」といいます。
今回のA拠点・B拠点・C拠点はそれぞれ100名のOPRが在籍していて、その全員のデータがあるため、「STDEV.P」を用いて標準偏差を求めています。

・「STDEV.S」・・・不偏標準偏差（母集団の標準偏差の推定値）
注目してほしいのは『推定値』であることです。
今回の例では全員のデータがありますが、もっと大規模なコールセンターの場合、応対品質スコアは毎月全員分ではない場合が往々にしてあるかと思います。
そういった場合には、「STDEV.P」ではなく「STDEV.S」を使うことで、全体（母集団）の標準偏差の推定値を得ることができます。

多種多様なコールセンターを運営するビーウィズが、これまでの運営ノウハウを集約し、通信販売事業成長のポイントや顧客に対する効果的な施策などをご紹介いたします。