February 22nd, 2009

moth

A Girl Named Florida - II (a mental trap)

Spoiler alert - please read this post first: "A Girl Named Florida".

If a family has two children, the probability that both of them are girls is 25%. GG is 1 out of 4 equiprobable outcomes: BB, BG, GB and BB.

If we also know that one of them is already a girl, then this probability jumps up to 33%. Now it is 1 outcome out of 3: BG, GB and GG.

If we also know that the name of one of the girls is Florida, then the probability jumps even higher, to almost 50%. Suppose there are 1000 boy names and 1000 girl names (all equiprobable), and one of girl names is Florida. Then we have the following possible combinations: B-GF, GF-B, GF-GNF, GNF-GF and GF-GF which represent 1000*1 + 1*1000 + 1*999 + 999*1 + 1*1 = 3999 outcomes, of which 1999 are favorable (two girls). It makes the probability of having two girls being 1999/3999 ~ 49.9987% (almost 50%).

In each of these cases we have some extra information comparing to previous case: first we learn that at least one of the children is a girl, and then we also learn her name. How does this extra information can increase the probability of the other child's sex? ...Does it really?

Imagine you approach a family with two children who (you know that) have at least one girl. At this point you can figure that the probability of them having two girls is 33%. Now the parents tell you that one girl's name is Florida. The children didn't change - how come that probability of two girls jumped to 50%? What if they gave you another name? You could use similar reasoning to conclude that the probability, again, rose to about 50%. It means that the name doesn't matter. But then it means that the probability stays the same 33%. What's the catch?



Предупреждение о спойлере - пожалуйста, прочтите сначала вот этот пост: "A Girl Named Florida".

Если в семье двое детей, вероятность, что они оба девочки 25%. ДД это 1 из 4 равновероятных исходов: ММ, МД, ДМ и ДД.

Если мы уже знаем, что один из детей - девочка, то вероятность подпрыгивает до 33%. Теперь это 1 благоприятный вариант из 3: МД, ДМ и ДД.

Если мы также знаем, что имя одной из девочек Флорида, то вероятность подпрыгивает ещё выше, почти до 50%. Предположим, существует 1000 мужских и 1000 женских имён (все равновероятны), и одно из женских имён - Флорида. Теперь у нас есть следующие возможные комбинации: М-ДНФ, ДФ-М, ДФ-ДНФ, ДНФ-ДФ и ДФ-ДФ, и этим комбинациям соответствует 1000*1 + 1*1000 + 1*999 + 999*1 + 1*1 = 3999 исходов, из которых 1999 благоприятные (две девочки). Таким образом, вероятность двух девочек равна 1999/3999 ~ 49.9987% (почти 50%).

В каждом из этих случаев мы получаем некоторую дополнительную информацию, по сравнению с предыдущим случаем: сначала мы узнаём, что один из детей - девочка, а потом также узнаём её имя. Как эта дополнительная информация влияет на пол другого ребёнка? ...А влияет ли она вообще?

Представьте себе, что вы приходите к семье, в которой есть двое детей и, вы знаете, что по крайней мере один из них - девочка. В этот момент вы можете прикинуть, что вероятность двух девочек равна 33%. Теперь родители говорят вам, что имя одной девочки - Флорида. Дети не поменялись - каким образом вероятность двух девочек могла подскочить до 50%? Что если родители назвали бы другое имя? Вы могли бы применить подобные рассуждения, чтобы заключить, что вероятность всё равно повысилась до 50%. Это означает, что имя не играет никакой роли. Что, в свою очередь, означает, что вероятность должна остаться на прежнем уровне - 33%. Где подвох?