ちしきよく。

雑多系ブログ。みなさんの「何かを知りたい!」という欲を叶えましょう。

直感に反する面白い確率問題・答え合わせ編



あとで読む

昨日の記事の答え合わせである。

www.chishikiyoku.com

解答には細心の注意を払っているが、間違いがあるかもしれない。

見つけたら教えてほしいです。お願いします。

 

2つのサイコロ

2018年6月1日0時20分追記:以前の問題文が紛らわしかったため改題してます。*1

 

私はあなたに背を向けてそれらを振ったため、出目は確認できなかった。

しかし私は2つのサイコロの出目を、あなたにわからないように見ながら「少なくとも1つは6が出てますよ」と言う。

私の言うことが本当ならば、両方とも6である確率はどれぐらいだろう。

 が正しい問題文です。

 

 

サイコロで出る目は互いに独立なので6分の1……としてはいけない!

 

確率の操作の基本に「同じサイコロでも区別する」というのがある。

サイコロ1とサイコロ2の出目を表にしてみると、下のようになる。

f:id:zetakun:20170629094853p:plain

すなわち、見分けは付かないけど、確率を計算するときには、両者を区別するのだ。

 

 

ここに、少なくともどちらか片方が6になるものをマル、そうでないものをバツとして書き込んでいくと、

f:id:zetakun:20170629095553p:plain

となる。〇は11個あり、そのうち「どちらも6である」のは1個。

よって、確率は11分の1になる。

 

ここで気付くべきなのは、「そもそも片方が6じゃないとゲームが始まらない」という事実。

つまり、「少なくとも1つのサイコロは6である」という前提条件が必要だから、普通の場合の確率とは数字が違うのである。

 

 

ちなみに以前の問題文なんですが、

私があなたの目の前で2つを振って見せたが、あなたが出目を確認する前に、そのうち一つを手で覆い隠してしまった!

隠されてないほうのサイコロは6だったことをあなたは確認したが、このとき、私が手で隠しているほうのサイコロの出目も6である確率を求めよ。

これだと解釈によっては6分の1にもなりますね。

条件つき確率ということでとらえるならば「片方のサイコロの6が出たことでゲームが始まった」といえるし、普通の確率なら「片方のサイコロの出目はもう片方に影響を与えない」となるしで、娯楽を求めた結果書き方が紛らわしくなりました、スミマセン……。

 

箱に隠したトランプは…?

最初に箱に入れてるから、後から見たハートの図柄3枚は確率に影響しない……よって52分の13で、答えは4分の1だ!!としたら間違い。

 

その理屈で行けば、後から13枚見た結果が全てハートの図柄でも、箱に入れたトランプがハートの確率が4分の1になってしまい、おかしくなる。既に13枚出ているからハートの確率は0になるはず。

 

ここで気を付けるのは、「図柄を見ていないのだから、先に箱に入れても後に入れても確率は同じ」という事実。

確率は情報を入手すれば変わってくるけど、入手してなければ変わらないのだ。

 

問題を変えて、

「最初に3枚見たら全部ハートの図柄だった。次に引くカードもハートである確率を求めよ」としてもよいはずで、そうすると皆さん正しい答えを出せると思う。

 

 

だからこの問題の答えは、

(52-3)枚中、(13-3)枚のハートを引く確率だから、

答えは49分の10となる。

 

 

ガチャ

確率の操作に慣れない人は、「確率1%のやつを100回施行すれば、必ず1回は起きる」みたいに思っているかもしれないが、それは違う

計算はたぶん100分の1に100をかけて1になったからこう結論づけたのだろう。

 

ためしに、「1枚のコインを2回振ってみて、2回中必ず1回はオモテが出るかどうか」を考えてみるといい。

さっきの例と同じように考えれば、2分の1に2をかけて、1になるから、必ず1回は起きるのだ……となるが、実際には「2回ともオモテが出るのが4分の1、オモテウラ両方出るのが2分の1、2回ともウラになるのが4分の1」だから、必ず1回はオモテが出るなんて言えない。

 

今回の問題の計算方法は以下のようになる。

まず、

「100分の1の確率で当選するガチャを100回引いて、当たりが出る確率」

というのは、

「ガチャ100回引いても、一回もあたりが出ない確率」を、全体(つまり1)から引いたもの

とみなすことができる。全体というのはあらゆる試行のことだ。当たりが出たとかでないとか何回出たとか、そういうのは抜きにして、とりあえずあらゆる試行をカウントする。

なぜ全体の確率が1になるのか。それは、全体の試行を言い換えると、「出現しうるパターンの中で、どれかにヒットする確率」だからだ。サイコロ2個の例でいえば、「サイコロを2個振って、どれかの目が出る確率」が全体の試行、つまり1である。

サイコロを振ったのに目が出ないということはないように、ガチャも、100回引いて当たりが何回目かに出たり、何も出なかったりするが、それら全部をカウントしたのが全体の試行なので、やはり確率は1である。

 

f:id:zetakun:20171130211110p:plain

で、100回やっても一回も当たらない確率というのは逆にいえば、「100分の99で当たる確率のガチャを100回引いても1回も当たらない確率」と同じなので、100分の99を100回かけて、それを1から引けばよいことになる。これを求めるとおよそ0.634

だいたい60%は、少なくとも一回は当たることになる。

 

いや逆に言った方が伝わるだろう。「100回ガチャを引いたのに、1回も当たりが出ない確率は、だいたい37%である」と。これを大きいとみるか小さいとみるかは、あなた次第だが。

 

ちなみに……試行回数と「1回も当たらない」確率の関係をグラフにしてみたらこうなる。

f:id:zetakun:20171130213928p:plain

横軸が試行回数、縦軸が「1回も当たらない確率」。ほとんど当たると断言できるため(=当たらない確率が5%以下になる)には、300回も回し続けなくてはならない。

ガチャ沼、おそるべし。

 

同じ誕生日

これもまあ、意外や意外。人間の直感なんて全然アテにならないとわかる、良い問題だと思う。別名を「誕生日のパラドックス」というぐらいだもの。パラドックスというのは、「一見違うように見えるけど、それが真理であるもの」ぐらいの意味。

 まず、同じ誕生日のペアが少なくとも2人いる確率、というのを数学的に記述すると、こうなる。

 

1 - (その場にいる全員の誕生日が全部違う確率)

 

つまり、例えば2人いたら、2人目は1人目と誕生日が違うのだから、1 - 364/365になるのはわかるだろう。3人だったら、「2人目は1人目と誕生日が異なり、なおかつ、3人目は1人目や2人目と誕生日が異なる」のだから、1 - (364 / 365) × (363 / 365)となる。

この調子で計算をやっていくが、だいたい「23人」いれば、確率は半分超えてしまうのである。

 

とても信じられないからもう一度言う。

「23人の中に誕生日が同じペアが(少なくとも)1組存在する確率は2分の1」

f:id:zetakun:20171130223428p:plain

上のグラフがそれを示している。横軸が人数、縦軸が「同じ誕生日のペアが少なくとも一組存在する」確率である。

実はこれ、私の中学校の数学の授業で実際にやったことがあるのだが、見事1ペア、誕生日が同じ2人がいた!

 

皆さんも実際にやってみよう。

 

なくしたチケット

これ割と混乱してしまうし、下手に確率論に精通した人が解こうとすると、n=1000まである漸近式とか書こうとして失敗しがちである。

確率のとっつきにくいところとして、「時間軸を無視する」というのがある。すなわち、今回であれば「最初の人が座った後、2番目が座り、……一番最後の人が座る」と考えがちであるが、そうする必要はない、……いやむしろこの問題に関していえば、考えないほうが良いのである。

 

結論から言おう。答えは「2分の1」である。

なぜなら最後の人が座る段階になったとき、その人が座る席は「自分の席か、そうでないか」の2択しかないからだ。

 

時間的な流れを考慮するとわけがわからないが、この問題に関しては「席が埋まったかどうか」のみを考えればよく、「いつ席が埋まったか」については考えなくてよいので、こうなるのだ。

 

言葉足らずでid:kamikunさんから指摘がありましたので追加の説明です。

 

1番目、2番目、3番目……以降998番目の人達ならこうはいきません。一番最後の人も彼らも、「自分のイスに座れるか、座れないか」という2択であることには変わりないのですが、一番最後の人に限り「自分のイスかそうでないか」という2択の確率に、全く優劣がないんですね。

 

ほかの人達は、例えば2番目の人は、「(1000分の999の確率で)自分のイスに座れるか、(1000分の1の確率で)自分のイスに座れないか」という、確率の違う二択、誤った二択なのに対し、最後の人は「(2分の1の確率で)自分のイスに座れるか、(2分の1の確率で)他の人の席か」という、確率の同じ二択なんです。

だからこのようなことが可能なわけで、この問題を他の人にも適用できるわけではない、ということです。

 

ではいったいなぜ優劣がないか、ということを説明してみます。

 

 

乗客が2人の場合を考えます。

ありうるのは2パターン。

「1番目の座席に1番目の人が座り、2番目の座席に2番目の人が座れる」パターン。

「1番目の座席に2番目の人が座り、2番目の座席に1番目の人が座る」パターン。

この2通りですね。1番目の人がどっちを選ぶかはランダムなので、50:50といえます。

 

 

 

 

この後、3人の場合も考えたいのですが、一気に飛ばして1000人にいきます。

無数にあるのですが結局考えなければならないのは「1番最初の人の席」「1番最後の人の席」だけなのです。めんどくさいんで1番最初を私、1番最後をあなたとします。

 

で、あなたが自分の席に座れればあなたの勝ち、座れなければあなたの負けとします。

 

私が自分の席に座るか、またはあなたの席に座れば、ほかの998人は皆「自分の席が空いていたら自分の席に座る」を実践するわけですから、考えなくて済みます。時間スキップ機能が使えるのです。

結局あなたは、私がどちらを選んだかで座る席が決まるわけですから、確率の等しい2択を選んでいるのと同じ。勝ち負けは50:50ですね。

 

では私が330番目の席に座る場合を考えましょう。

2番目から329番目の人はみんな自分の席に座りますね。その後、330番目の人はランダムに選ぶわけです。このとき彼が私の席に座れば、331番目から999番目の人は自分の席に座ることができて、あなたの勝ち。彼があなたの席に座れば、その時点で負け。

ではほかの席に座った場合は?

その場合は、その席に座るはずだった人が、彼と同じことをするわけです。

私の席か、あなたの席に座るか、ほかの席に座るか。

例えば330番目の人が600番目の席に座ったら、331番目から599番目の人は自分の席に座り、600番目の人が「私の席か・あなたの席か・ほかの席か」という決定を行います。330番目の人と、やってることが同じなんですよ。

 

要するに、「ほかの席に座る」という行為は、勝ち負けの決定を先延ばししてるだけにすぎない、ということです。

完全にランダムで座るなら、1000分の1の確率でしかあなたは勝てませんが、「自分の席が空いていたらそっちに座る」という前提がある以上、確率は2分の1なのです。

 

ここまで説明すればたぶん大丈夫かと思います。

 

 

 

情報提供ありがとうございました!

 

席替えしよう

直感でわかった方もおられるかもしれないが、実は「クジをいつ引いても確率は変わらない」が正解である。

実際に計算しよう。まず一番最初にクジを引いてお目当ての席をゲットできる確率は、

49通りのうち1通りなので、49分の1である。

では二番目だとどうなるか?一番目の人がそのお目当ての席をゲットせず、なおかつ自分がゲットできる確率なのだから、

(1-(1/49)) × (1/48)となり、ありゃりゃ、また49分の1。

最後の場合も同じように考えてよい。

 

いつ引いても確率が変わらないからこそ、くじ引きは平等なのである。ドラフト会議、万歳。

ちなみにあみだくじだとこうはいかない。あれは真ん中を選べば、真ん中に落ちる可能性が最も高くなるクソゲーなのである。公平な場面では使用しないことを勧めます。 

 

追記:そうでもないらしいです。

どうも秋山仁という人が「JSTバーチャル科学館」というサイトにて、「真ん中に当たる確率が一番高い」ということを、作為的に選んだあみだくじによって証明したことから、このデマが広がったらしいです……!

それどころか、「普通に」*2あみだくじをやれば、確率はほぼ均等になる、というシミュレーションの結果も出ているようです。

この問題は面白いので、後日取り上げたいと思います。

チョコレートバー(@Air_Hoid)さん、教えていただきありがとうございました!

 

先手と後手どっちが有利?

これ、「先手!」と即答できる人は大勢いるだろう。しかし「なぜ先手のほうが有利なのか」と聞かれると答えに詰まってしまうに違いない。

基本としては、先ほどの席替えの問題と同じであり、

何手目に引いても、赤が出る確率は301分の1である。時間軸を固定して考えてしまうとその部分から詰まってしまう。

 

ただし、席替えと同じく「先手も後手もどちらも同じ!」と即断するには早い。

 

これも飛行機チケットの問題と同じく、発想を転換させる必要がある。

ルール上は「赤いボールが出た時点で勝負が終了する」とあるが、これを書き換えて「赤いボールが出ても勝負を続け、ボールを全て取り出した時点で勝負終了、赤を持っていた人の勝ち」としてみよう。どうせゲームが終わった後のことは考えなくてよいのだから、逆にこうしてみてもいいはずである。

 

そうすると、先述のように何手目に引いたかどうかは関係ないので、あとは「合計で何手引けるか」のみが、当たる確率の大きさを左右することがわかるだろう。

先手の人は最大で151手引くことができて、後手は150手しか引けないことがわかる。赤を引く確率は何手目であっても301分の1であるが、引ける手の数がわずかに先手のほうが多いので、先手が有利だとわかるのだ。

 

偽陽性問題

確率論が非常に難しく見える原因として、「条件付き確率」の本質的理解が困難であるというものが考えられるが、この問題はまさにそれを代表する例である。

 

確率に精通しない人ならば、普通に「え?90%じゃないの?」と答えてしまいそうなこの問題であるが、それは違う。一番最初の「2つのサイコロ」と同じ類であり、

Bさんがこの検査を受けて陽性が出た、という事象を分母において、計算しなければならないのだ。

 

普通に「陽性が出る確率」であれば90%でよいが、条件付き確率はその「普通」とは異なり、前提条件が必要なので、必然的に確率も変わってくる。

一番最初の問題と同じなのである。

 

分母は「検査陽性、実際陽性+検査陽性、実際陰性」の確率なので(450+950)/10000、分子は「検査陽性、実際陽性」なので450/10000。

9/28が答え。

これはだいたい32.1%で、「陽性と出たとき本当に陽性である」のは、この問題であればだいたい3人に1人。ワクチンに副作用があるとかだとけっこう深刻じゃなかろうか。

 

面白いのはここからで、「陰性と出たけど本当に陰性である確率」は(計算は略)99.4%であり、さっきと全く違う。何となく「どうせ100から32.1ひきゃいいんだろ」と思いがちだが違う。

 

裏を返せば、1000人に6人は「ほんとは感染してるのに陰性と出てしまう」のだ。

 

これらをそれぞれ「偽陽性」「偽陰性」と呼び、どの検査薬にも付きまとってくる、非常に難しい問題である。

ここによれば、HIVの偽陽性は1000人におよそ1~3人である。多いと見るか、少ないと見るか。

 

※現実では、偽陽性でないか確かめるため、数か月後に再検査したりする。

 

十発十中のガンマン 

えーと、人数かける命中率は赤も青も同じ……。

てことはどっちも同じ!!

と答えたアナタ、全滅です。

これはほぼほぼ青軍が勝つと言ってよいのだ。

 

実際に青軍が1度目の発砲で勝つ確率を求めよう。

青は1人での命中率が10%なので「10人全員外す確率」は9/10を10回かけて35%。

裏を返せば「1回目で青が勝つ確率」は65%である。

 

失敗してもよい。2回目は9人全員でベテラン赤を狙うのだ。

 

このように計算していくと、「青軍が勝てない確率」の計算結果はこうなる。

 

f:id:zetakun:20180227000856p:plain

 

つまり9回目の射撃でも勝てない確率はめちゃめちゃ低い。9回目までにはほとんどの確率で青が勝っている、と結論づけることができる。

 

この面白い話は一説には日本海海戦で大勝した東郷平八郎に遡る。

「百発百中の大砲1門は、百発一中の大砲100門にも匹敵する」という彼のことばは、恐らく練度の大切さを教えるものであろうが、確率論的には間違っている。

もちろん彼とてそのことを知らなかったわけではあるまい。

しかし、1回目から10人からの斉射をうけ、9回目までに生き残る確率が0.003%のベテランガンマンの気持ちを汲めば、大和魂でなんとかなるものでもないのだろう……。

 

円周率の電話番号 

*3

 

よくいう「無限の猿定理」である。

 

無限の数列・文字列があれば、(有限個の)どんな配列もそこに収納されうる、というもの。これを実際に確かめるのが本問だ。

11ケタ中に11ケタ電話番号がある確率は、(1/10)の11乗、めっちゃ小さい。

 

12ケタだと考えうるのは20通りあるから、(1/10)の11乗に20をかけたものになる。

下図参照。

f:id:zetakun:20180531222511p:plain

こうやってやっていっていいのだが、22ケタを超えると問題が生じる。

最小で22ケタ、実は重複が起こるのだ。つまり自分の電話番号が「2つ」入る可能性があるのである。こうやってカウントしてもいいけど、なかなか難しい。

 

そのため、ガチャの問題と同じように、「1回も自分の電話番号が出ない」場合を考えてみる。

 

f:id:zetakun:20180531222904p:plain

11ケタならば、自分の番号が1回も出ない確率は1-(1/10)^11である(^は累乗を表す、つまり10分の1を11回かけるということだ)。

12ケタならばどうなるだろう?

やはり、

f:id:zetakun:20180531223042p:plain

というように考えてやるといい。

電話番号が出すガチャを「2回」繰り返すと考えるのだ。

2回とも外れが出る確率は(1-(1/10)^11)^2になる。

 

13ケタならこれが「3回」になる。

 

ということは、xケタの数字列がある場合、そこに1回も自分の番号がない確率は

 

(1-(1/10)^11)^(x-10)となる。

電話番号を出すガチャを(x-10)回やって、1回もあたりが出ない確率、と言い換えてもいい。

 

今回は当たりの話なので、これを1からひいてあげて、

 

1-(1-(1/10)^11)^(x-10)が求める確率となる。

そしてこれが0.99より大きくなるには、なんと4.60517かける10^11回、つまり4605億1700万もの数字が必要になるという。

 

「円周率がランダムな数列とすると、どんな画像データも全て円周率には含まれているので、いずれ円周率のケタ数のみを指定すれば、画像が呼び出せるようになるかも?」という考えはあるようだが、この問題を解くとそうでもないように思える。

 

以上、確率の良問、答え合わせであった。

 

 

 

エッセンスと銘打っていますが実際は問題集です。

アマゾンの評価が高くないのはそういう理由です。

 

しかしながら、「直感に反する」という問題をたくさん揃えている点ではぜひお勧めしたい一冊。この記事に載っていない様々な問題が、あなたを待っています。*4

巻末には未解決の確率問題有り。興味がある方は挑戦してみては?

 

 

ソースが不明なのが若干怪しいけど、話のツカミとして絶対に損はない一冊。

三毛猫が生まれる確率、というような雑学マニアにはおなじみの確率から、飛行機で事故に遭う確率、女子高生の娘が飲酒をしている確率、東京のひとができちゃった婚をする確率など、気になるけど調べにくい、さまざまな事象についての本。

 

 

 確率分野ではありませんが、頭をやわらかくしないと解けない、数学の様々な分野を駆使しないと解けない、むずかしい問題達が勢ぞろい。

論理的なパズルの好きな方々にも、脳をフル回転させたい方にもオススメできる本です。

*1:id:hammurabi-tさん、id:misoshirukakegohanさん、情報提供ありがとうございます

*2:文字通り、普通に、常識的に

*3:id:misoshirukakegohanさんからの御指摘がありました、重複も考えないといけないので、以前の解答じゃ駄目ですね、ありがとうございます!!

*4:逆に、この本から引用したのもけっこうあります