大学の授業で回帰分析をエクセルで行う方法を学びましたが、その手法と分析結果から得られる内容がよく理解できません。ビジネスをする上で、どのようなケースで使うのでしょうか?
MinShuan
2018.10.06 13:37:03
1490
こんにちは、はじめまして。
そして初解答になります。
勝手がよくわかりませんがよろしくお願いします。
回帰分析の結果ですね。
なかなか難しいですが、見るポイントは何か所かに限られています。
例えばよくいい例になるのは、気温とビアガーデンのビールの販売数の関係です。
常識的に考えれば気温が高ければビールの販売数が伸びますよね。
毎日、気温とビールの販売数を記録していきます。
これは、2つの関係が一致しているかを表していますね。
ご存知かと思いますが、原因と結果という関係で見れば、気温が原因で、結果が売れ数です。その関係を1からー1の間で示します。
ビールが売れたら販売数がいかに伸びるかを示しています。
気温が上がればビールが売れるというのがデータ的に立証できれば+の相関。
逆に気温が上がればビールが売れないというのがデータ的に立証できれば-の相関。
気温が上がろうが下がろうがビールが売れゆきとは関係ないというのがデータ的に立証できれば0の相関。
という具合になります。
相関係数の二乗が重相関係数になります。
1~-1の数値であれば、二乗すれば相関係数より重相関係数の方が厳しく見えるので、私は重相関係数を見ています。
回帰分析をする目的は、データの予測をする方程式を求めることにあります。また、それで求めた結果がどれだけ正しいかを判断し、採用できるかどうか人間が決めます。
回帰分析すると切片と傾きを求めることができます。
これは式にすると
結果=傾き×原因+切片
という方程式になります。
つまり明日の予想気温をこの式に当てはめ、回帰分析で求めた傾きと切片を代入すれば、明日のビールの販売個数の予測が出せます。
となると、ビアガーデンが酒屋さんに注文する数もだいたい検討がつくので、品切れでお客さんに迷惑かけたとか、在庫が余っちゃって倉庫に入りきらないとかというリスクがなくなります。
あくまでこれは予想にすぎません。
気温が高くてもお客さんが来ないこともあるでしょうし、そうでないかもしれません。
それを表すのが95%信頼区間です。
この数値が。。。なんだっけ。。。
この数値くらいの誤差に収まる確率が95%。という意味ですね。
それが大きければ予想は外れる確率が高いでしょうし、小さければ予想通りになる確率が高いと判断できます。
この結果を総合的に判断し、ビアガーデンの店長さんの勘的なものも加味して判断して注文数を決めるのかなという感じです。
データが増えれば増えるほどこの値は収束するはず。なのですが時々乖離していくものもあるので、それはデータの取得方法が正しいのか、それとも偶然他の原因でなってないか精査する必要があります。
気温の他にももっと原因になることがあるかも知れません。
その場合、重回帰分析といって、これもExcelで出してくれます。
例えば、湿度とか、風速とか。
その場合、方程式は
結果=(原因1×原因1の傾き+原因1の切片)+(原因2×原因2の傾き+原因2の切片)+(原因3×原因3の傾き+原因3の切片)
となります。
これも代入すれば結果の値を求めることができます。
もちろん、湿度と風速のデータも記録しておいてそのデータを使って分析します。
この場合、相関係数が0に近い原因ほど関係ないのかなと言えるので、相関係数・重相関係数の値を見ながら無視するとか決めたらいいと思います。
重相関係数±0.6で相関強くあり、±0.3でまああるかな、それ以下は無いと私は判断しています。
回帰分析では予想ができる方程式を手に入れることができる!
ビジネスシーンにおける予想は、仕入れや次年度の予算、果物の取れ高とかも予測できるような気がします。
自分は、Twitterのつぶやき数と新規顧客の問い合わせ数の関係なんかを分析しています。あまり関係なさそうなんですけどね。
佐藤嘉浩(Excelの魔法使い・スピラー)
2018.10.07 00:08:35
佐藤さん、丁寧にありがとうございます!回帰分析の必要性を理解できました!
エクセルでこれを表現しようとするとどうなるのでしょうか?
|
コメントするには ログイン していただく必要があります。