数字(量的変数)の切り口【足し算の分解②】

足し算の分解の切り口

このエントリーでは、足し算の分解の切り口のうち、数字(量的変数)による分解を勉強しましょう。

なお、このエントリーは一連の「足し算の分解」の一部なので、以下のエントリーから順に読んでください。

では始めていきましょう。

足し算の切り口①:数字

足し算の分解の切り口

足し算の分解の1つめの切り口は、数字です。表の上側ですね。専門用語では量的変数と呼ぶので、これも頭の片隅に入れておいてください。具体的には、以下のような切り口です。

  • 時間
  • 年齢
  • 金銭
    • 収入
    • 価格
    • その他(売上、利益、コストなど)
  • 重さ
  • 速さ

これらはどれも、数字で表現できますよね。数字を切り口に分解するとは、これらの概念を使って論点を分解することです。

分解の具体例

具体例をいくつか見ておきましょう。ここでは、「どのような人が、この商品を買っているのか?」という大論点を2パターンの切り口で分解してみます。

まずは、年齢(年代)で分解してみましょう。以下のようになります。

  • どのような人が、この商品を買っているのか?
    • 10歳未満の人か?
      • ※この年代が重要であることは稀なので、ここは落としても構いません
    • 10代の人か?
    • 20代の人か?
    • 30代の人か?
    • 40代の人か?
    • 50代の人か?
    • 60代以上の人か?

分解した小論点に数字が含まれていることを確認してください。

次は、同じ大論点を収入で分解してみましょう。

  • どのような人が、この商品を買っているのか?
    • 年収200万円未満の人か?(x < 200)
    • 年収200万〜400万円の人か?(200≦ x < 400)
    • 年収400万〜600万円の人か?(400≦ x < 600)
    • 年収600万〜800万円の人か?(600≦ x < 800)
    • 年収800万〜1,000万円の人か?(800≦ x < 1000)
    • 年収1,000万円以上の人か?(1000 ≦ x)

同じように、分解した小論点に数字が含まれますよね。このような分解が、数字を切り口にした論点の分解です。

練習問題

では、練習問題で確認しましょう。

Question

以下の論点を、カッコ内で指定された切り口で分解せよ。

Q1

いつ、この商品は売れているのか?(「朝」・「昼」などの時間帯)

以下に解答欄がありますので、答えを書いてみてください。自分で書いた方が、ずっと効率的に学習できます参考)。分からなくても、トライしてくださいね。なお、この解答欄に書いたことは保存できないので、解答を保存したい場合は自分のメモアプリなどを使ってください。

  • いつ、この商品は売れているのか?
    • 深夜(0時 – 6時)か?
    • 朝(6時 – 12時)か?
    • 昼(12時 – 18時)か?
    • 夜(18時 – 0時)か?
Q2

この高速道路は、どのように走られているのか?(時速)

  • この高速道路は、どのように走られているのか?
    • 時速80km未満か?
    • 時速80km〜100kmか?
    • 時速100km〜120kmか?
    • 時速120km以上か?

制限速度を守って運転してくださいね。

時間の切り口の注意点:階級を決める

時間の切り口で分解するときには、自分で適当な階級を設定する必要があります。先ほどの例で確認してみましょう。

  • どのような人が、この商品を買っているのか?
    • 年収200万円未満の人か?(x < 200)
    • 年収200万〜400万円の人か?(200≦ x < 400)
    • 年収400万〜600万円の人か?(400≦ x < 600)
    • 年収600万〜800万円の人か?(600≦ x < 800)
    • 年収800万〜1,000万円の人か?(800≦ x < 1000)
    • 年収1,000万円以上の人か?(1000 ≦ x)

見てのとおり、この例では「200万円ごと」を間隔の単位にしています。言い換えると、200万円ごとの年収帯を作っているわけです。

このような、「数字の切り口で分解する際の区間」のことを階級と呼びます。

Keyword

階級:数字の切り口で分解する際の区間

階級は必ず決めなければなりません。理由はシンプルで、階級を作らないと分解(分析)しようがないからです。

そもそも、「1円」や「1歳」レベルの間隔のデータは存在しないことも多い上に、それでは情報が分かりやすいレベルに収まりません。あくまでも大論点に答えるために論点を分解しているのですから、答えが出しやすいようにデータを整理する必要があるのです。

時間の単位(階級)

なお、「時間」を切り口にする場合は、すでに細かい階級が専用の単位として用意されています。それだけ、時間というのは私たちの生活に深く根付いているということなのでしょう。

代表的な時間の単位を、以下にまとめておきます。状況に応じて、適切な大きさの単位を選んでください。

  • 時間(hour)
  • 朝・昼・夜
    • ラフに分解したいときに便利です
    • ただし、「朝(7時-12時)」のように、定義を明確にしましょう
  • 四半期(3ヶ月ごと)
    • ビジネスでよく使います
  • 数年間ごと
    • 例:2001-2005年、2006-2010年、2011-2015年、2016-2020年(5年間ごと)
  • 数年おき
    • 例:2000年、2005年、2010年、2015年、2020年(5年おき)
    • 各年のデータが取れない場合か、超長期にわたって(50年間など)大雑把な傾向が見たいときのみ使いましょう。原則としては、データを隠すべきではありません

もちろん、必要に応じて「分」や「秒」なども使ってください。

練習問題

Question

以下の論点を時間で分解する場合、適切な時間の単位は何か考えなさい。

Q1

あなたは浪人生である。いつ勉強するべきか?

この場合は「時間(hour)」でしょう。1日の中で適切な睡眠・食事・休憩・運動などの時間を確保したら、あとはすべて勉強するべきですね。浪人生なので、平日と週末を分ける意味もありません(鬼軍曹)。

Q2

今後の日本人口は、どのように推移するか?

この場合は「5年おき」がベストでしょう。感覚的な話ですが、現在が2019年なので、2050年くらいまではデータを見たいですよね。それだと、各年ではデータが多すぎます。また、このケースでは大雑把な傾向が知りたいだけで、各年の細かい変動には興味がないでしょう。

階級の決め方

では、どのように階級を決めたらよいのでしょう?

まず、原則として、階級は網羅的であるように(MECEであるように)設定します。ただし、先ほどの年齢の分解での「0歳代」のように、明らかに重要でない階級は最初から落としてしまっても構いません。

また、年収帯などで分解する際には、言葉だけではどうしてもダブりがないこと(互いに素であること)を表現しにくいので、分解の際には頭に数式を意識するとよいでしょう1

その他に考えるべきことは、以下の2つです。

  1. 階級の数
  2. それぞれの階級の幅

順に考えてみましょう。

階級の数

まず階級の数ですが、これに関する明確な答えは出せません。「最適な階級の数はいくつか?」という問いは、幾人もの研究者が検討した上で、まだ決着のついていない問いのようです(参考)。

ただ、間違いなく言えるのは「階級が多すぎると分かりにくい」ということです。細かくすればよいわけではありません。

実際に論点を分解する際には、階級は少なくとも4-5つにはなるはずです。そこから数が増えるほど分かりにくくなるということは覚えておいてください。

階級の幅

階級の数が決まれば、おのずと階級の幅も決まるはずです。

なお、特に理由がない限り、階級の幅は等間隔にするべきです。途中で間隔の幅が変わっても分かりにくいですからね。年収の例なら、「200万円」を間隔にしたならそれを維持するべきで、途中でその間隔が「100万円」になったり「500万円」になったりするべきではありません2

ただし、数字には「上限がない」という性質がありますので、上限の階級だけは「XX以上」と扱うしかありません。

では、どこからを上限の帯として扱うべきかですが、上限の階級には重要性が残らないようにするのが原則です。上側が無限大に広がっている以上、「その階級が重要だ」という話にはしたくないわけです。

具体的には、上限の階級におけるデータの出現頻度(度数)が10%以下になるくらいを目安にするとよいでしょう。これなら大事には見えません。逆に、15%くらいを超えてくると、もう少し階級を細かくした方がよい気がします。

ということで、ハッキリしたことは言いにくいのですが、度数との兼ね合いで上手く階級を調整してください。

以上、数字を切り口にした足し算の分解を説明しました。次回はカテゴリー(質的変数)を切り口にした分解を学びましょう。

また、ロジカルシンキング関連のエントリーは以下のページにまとめてあります。こちらも参考にしてください。

参考文献


  1. もちろん、「未満」、「以上」などの言葉を厳密に運用すれば言葉でもダブりがないことを表現可能です。 

  2. ただし、年収帯の場合だと、1000万円までは200万円刻みで切って、そこから先を「1000-1500万円」、「1500-2000万円」、「2000万円以上」と切るようなケースはあります。各階級におけるデータの出現頻度(度数)との兼ね合いですね。