morfizm (morfizm) wrote,
morfizm
morfizm

Categories:

A Girl Named Florida - III

The biggest trap that can catch unsuspecting minds, and make them argue endlessly about probabilities, is the fact that probability is only defined in the context of experiment. You need to define how you will conduct the experiment - which events will you consider, and what slice of them you will treat as successful, in order for probability to make any sense.

If you only look at *one family* (and never assume that you will select many other families), then any probabilities about sex of children cannot be defined. If they are, then it is critically important how exactly the family selection process will occur.

In regards to the Florida problem's, imagine the following experiment:
1. Dima and Andrew visit every family in the world.
2. As they approach every family, they ask them if they have exactly two children and if at least one of them is a girl. If no, you skip this family. If yes, go on.
3. Then Dima goes inside their house and looks at the children. If he actually sees two girls, he writes 1 on a yellow sheet of paper, otherwise he writes 0. Andrew knows nothing about that.
4. They reunion outside of the house and ask parents about the name of any one of their girls. Parents tell them a name. Imagine, it is Florida (for another family it may be another name).
5. Now Andrew looks at the children, and writes 1 on a white sheet of paper if he sees two girls, and 0 otherwise.
6. They repeat steps 2-5 for every family they meet.

Between step 4 and step 5 Andrew may think that the probability of the second girl jumped from 33% to almost 50%, because her name is Florida. This reasoning is incorrect, because it's apparent that number of 1s and 0s will be the same on both yellow and white sheets of paper, and the ratio of 1s to total number of digits will be about 33% (just because Dima produced the same result before knowing the name).

In fact, the 33% probability is based purely on selection of families: every family with two children with at least one girl is selected.

Now imagine if Andrew didn't record any observations in case if name wasn't Florida (a fixed, pre-defined name, which was choosen before the whole experiment). He would only play this game after hearing the name Florida. In this case, the ratio of 1s to total number of digits would be close to 50%. But the total number of digits itself would be much smaller than in Dima's yellow sheet of paper, because Andrew would only look at selection of families who have two children and at least one of them is a girl named Florida. This is a different selection, and that's why it results in a different probability.



Самая большая ловушка, в которую могут попасть доверчивые умы, и которая может заставить их бесконечно спорить о вероятностях, это тот факт, что вероятность определена лишь в контексте эксперимента. Необходимо определить, как именно будет проходить эксперимент - какие события будут рассматриваться, и какая часть этих событий будет считаться успешной, для того, чтобы понятие вероятности имело хоть какой-то смысл.

Если рассматривать только *одну семью* (и не подразумевать дальнейшее рассмотрение многих других семей), то вероятности относительно пола детей не могут быть определены. Для того, чтобы их определить, очень важно, как именно будет проходить процесс выбора семей.

В отношении задачи о Флориде, представьте себе следующий эксперимент:
1. Дима и Эндрю посещают каждую семью во всём мире.
2. Посещая каждую семью, они спрашивают, есть ли в ней ровно двое детей, и является ли хотя бы один из них девочкой. Если нет, они пропускают эту семью, иначе - продолжают.
3. Дима заходит в дом и смотрит на детей. Если он видит двух девочек, он пишет 1 на жёлтом листе бумаги, иначе пишет 0. Эндрю ничего не знает об этом.
4. Выйдя из дома, они снова встречаются, и спрашивают родителей об имени одной из их девочек. Родители называют имя. Допустим, это имя - Флорида (для другой семьи это может быть другое имя).
5. Теперь Эндрю смотрит на детей, и записывает 1 на белом листе бумаги, если видит двух девочек, и 0 в противном случае.
6. Они повторяют шаги 2-5 для каждой рассматриваемой семьи.

Между 4 и 5 шагами Эндрю может подумать, что вероятность второй девочки подскочила с 33% до почти 50%, потому что её имя Флорида. Это рассуждение неверно, потому что очевидно, что количество единиц и нулей будет одинаковым как на жёлтом, так и на белом листе бумаги, и отношение единиц к общему количеству цифр будет приблизительно 33% (хотя бы потому, что Дима получил тот же результат ещё не зная имени).

На самом деле, вероятность 33% основана исключительно на способе выбора семей: была выбрана каждая семья, имевшая двух детей, один из которых - девочка.

Теперь представьте себе, что Эндрю не записывал свои наблюдения в случае, если названным именем не была Флорида (где Флорида - фиксированное имя, выбранное заранее, до начала эксперимента). Он участвовал бы в игре только после того, как услышал имя Флорида. В этом случае отношение единиц к общему числу цифр было бы близко к 50%. Но общее число цифр само по себе было бы намного меньшим, чем на жёлтом листе Димы, потому что Эндрю смотрел бы только на выборку таких семей, в которых двое детей и имя одной из девочек - Флорида. Это другая выборка, и именно поэтому она приводит к другой вероятности.
Subscribe
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 2 comments