週あたりの平均勤務日数×1日あたりの平均労働時間=週あたりの平均労働時間、とならないことについて、詳しくなれる書籍やサイト、検索ワードなどが知りたいです。
平均値の積(乗算)について、具体例をあげます。
・週の勤務日数:平均は3日/週・・・①
Aさん1日、Bさん3日、Cさん5日
・1日の労働時間:平均は7時間/日・・・②
Aさん12時間、Bさん6時間、Cさん3時間
↓
・週の労働時間:平均は15時間/週・・・③
Aさん12時間(1*12)、Bさん18時間(3*6)、Cさん15時間(5*3)
なぜ平均値の積①×②(3*7=21)と③((1*12+3*6+5*3)/3=15)が一致しないのでしょうか?
計算式の上で間違いであることはわかるのですが、
#(1+3+5)/3×(12+6+3)/3 ≠ (1*12+3*6+5*3)/3
A、b、cの平均人Xさんは週に3日、1日7時間働いた結果、週に15時間働いているってことになるというのが腑に落ちずにいます。
分散?偏差?が違うから母数(平均)を乗算したらダメなのかなぁ、となんとなくあたりをつけていますが、このことについて、どんなキーワードやサイト、書籍などで調べたらすっきり納得できるようになるかを教えて頂きたいです。
各自の「週の平均勤務時間」を提出させてその「平均」をとらないといけません。
平均日数×平均勤務時間はやってはいけない計算、意味のない計算です。
頭数(あたまかず、人数)で部分をそれぞれ割ってしまっている時点で全体にかかるはずの重み(偏り)がとりもどせないからです。
最後の平均は正しくは「重み付算術平均」「加重算術平均」にあたるようですが、日本語のウィキペディアに項目がなく、
http://en.wikipedia.org/wiki/Weighted_arithmetic_mean に同じように「午前のクラス20名の平均点と午後のクラス30名の平均点をそのまま足して2で割って全体の平均点としてはいけない、50人全員の点を足して50で割るならよい」という話がでています。
※まちがって2回おなじことをかきました。二回目は無視してください。
各自の「週の平均勤務時間」を提出させてその「平均」をとらないといけません。
平均日数×平均勤務時間はやってはいけない計算、意味のない計算です。
頭数(あたまかず、人数)で部分をそれぞれ割ってしまっている時点で全体にかかるはずの重み(偏り)がとりもどせないからです。
最後の平均は正しくは「重み付算術平均」「加重算術平均」にあたるようですが、日本語のウィキペディアに項目がなく、
http://en.wikipedia.org/wiki/Weighted_arithmetic_mean に同じように「午前のクラス20名の平均点と午後のクラス30名の平均点をそのまま足して2で割って全体の平均点としてはいけない、50人全員の点を足して50で割るならよい」という話がでています。
※まちがって2回おなじことをかきました。二回目は無視してください。
各自の「週の平均勤務時間」を提出させてその「平均」をとらないといけません。
平均日数×平均勤務時間はやってはいけない計算、意味のない計算です。
頭数(あたまかず、人数)で部分をそれぞれ割ってしまっている時点で全体にかかるはずの重み(偏り)がとりもどせないからです。
最後の平均は正しくは「重み付算術平均」「加重算術平均」にあたるようですが、日本語のウィキペディアに項目がなく、
http://en.wikipedia.org/wiki/Weighted_arithmetic_mean に同じように「午前のクラス20名の平均点と午後のクラス30名の平均点をそのまま足して割る平均して平均点としてはいけない、全員の点を足して50で割るならよい」という話がでています。
※まちがって2回おなじことをかきました。二回目は無視してください。
平均値①②を使って、平均値③を導くような方法はあるのでしょうか?
○回答者1号さん
「頭数(あたまかず、人数)で部分をそれぞれ割ってしまっている時点で全体にかかるはずの重み(偏り)がとりもどせない~」
○回答者2号さん(コメント)
「~同じ1日でも中身が違うわけです。平均日数を出すということは、この違いの情報を敢えて捨てるということ~」
とのことで、とりもどせない/捨ててしまっている情報があるから、計算は不可能だと認識したのですが、
・偏りを表す代表値(分散など)を使えば可能になる?
・特殊な条件下であれば可能になる?(勤務日数も労働時間も正規分布に従うとき、のような条件下)
特殊な条件下でも計算が可能な場合、このような「代表値同士の計算」について、解説している書籍・サイトなどがあれば知りたいです。
総労働時間を時間(hour)で比較すべき(たとえば労働単価は時給で算出する)場合に、「日数」という余計なパラメータを介在させた時点ですべてがマスクされて見えなくなります。「何日働いたかは関係ない。はたらいた時間だけ正確に給料をください。え、記録をつけてないんですか?労働基準法違反!」と従業員にいわれてしまいますね。
平均ですべてがすめば積分は要らないですし高価なパソコンと表計算ソフトもデータベース構築もいらないですw
分散も、右上がりグラフか右下がりグラフかは表現できません。
人間の行動は正規分布に全く従いません。(検定をするまでもなくすぐわかる)
もちろんサイコロをふって労働時間とその場合の労働単価を秒数まで完全にランダムに決めているのであれば正規分布に完全に従うとでも仮定しなければいけなくなりますが、それくらいなら最初から情報を保存しておくほうがマシです。
ピントがボケた写真をあとからくっきりさせてハエが1匹映っていたことを見いだすのもスタンド…超能力のない常人には無理です。
情報が失われるとはそういうことです。
余談ですが
http://www.asahi.com/articles/ASH2K4FXSH2KULFA00T.html
こちらの記事で個人情報法改正について報じられていますが、企業が匿名加工情報(平均値など)を出してよいのは、加工した時点でもとの情報が正確にはわからなくなるからですよ。分散くらいまでならともかく、グラフなどを出すと「わかる」ので文句がきますね。
むしろ、2変数の「積の平均-平均の積」を使うことを考えてみましょう。
2変数の「積の平均-平均の積」を各々の標準偏差の積で割ったものが(ピアソンの積率)相関係数になり、これが2変数の直線的な関係の指標となります。
きちんと学びたければ、相関について学びましょう。
おそらくそれぞれの分散の値を得ることが出来れば「平均した値をかけ算するとどれぐらい正しい値からずれるか」が分かるようになるはずですが、「どのようにずれているか」はその値からは分からないので正しい値を取り戻すことは出来ません。
すっかり遅レスになってしまい申し訳ありません。
3号さんの例えで、今回の疑問に関して自分の発想(日/週×時間/日=時間/週になるはず?)のナンセンスさにしっくりいきましたので、私の感覚的な理解の部分を、蛇足ですが記載させて頂きます。
○3号さんコメント
>図形に置き換えると感覚的に違っていることが理解できました
>A:縦1cm、横12cmの四角形(面積12cm^2)
>B:縦3cm、横6cmの四角形(面積18cm^2)
>C:縦5cm、横3cmの四角形(面積15cm^2)
【私の理解の内容】
①面積の平均を求める場合、ABCそれぞれの縦×横の計算結果が必要。
→縦の長さと横の長さのほかに、「縦と横の組み合わせ」の情報が必要。
#縦の長さが「1,3,5」の3つ、横の長さが「3,6,12」の3つ、だけがわかっていても計算ができない。
②縦の長さの平均と横の長さの平均を出す。
→この時点で「組み合わせの情報」を「捨てて」しまった。
③長さの平均同士を掛け合わせる。
→計算に必要な「組み合わせの情報」を省いて計算しようとしてるので、正しい結果にはならない。
※もし、この「組み合わせ」の情報が取り戻せる(逆算できる)ケースならば計算可能。
#特殊な分布で「各標本値にいくつ要素があるかが逆算」できれば可能(2号さんのコメント2)
#しかしそんなことができるケースは実際ほぼなく、それこそ「スタンド…超能力のない常人には無理です。情報が失われるとはそういうこと」(1号さんの回答3)
※情報を頂いた、「確率統計の大学レベルの教科書」(2号さんコメント2)や「ピアソンの積率/相関について」(4号さん回答)、「分散の値を得ることが出来れば「平均した値をかけ算するとどれぐらい正しい値からずれるか」が分かるようになるはず」(5号さん回答)などなどについては、この後、しっかり納得がいくまで調べて、考えて身につけたいと思っています。皆様ありがとうございました。
今思えば、こういった考え方?感覚?って算数の交換法則レベルの事だったのかも知れませんが。。。
このような話や、確率統計や相関などについて、私のような初心者レベルにオススメの読み物があれば、引き続き、情報いただけるようであればコメントに記載いただければチェック致しますので、ありがたいです。
念のため、|相関係数|≦1ですから、積の平均の代わりに平均の積を使った場合の誤差は各々の標準偏差の積の範囲に収まります。ですから、各々がばらついていなければ良い近似と言えますが、ばらついていると相関が大きいと悪い近似になります。
2015/02/24 11:23:29