?

Log in

No account? Create an account
   Journal    Friends    Archive    Profile    Memories
 

Человек не умеет придумывать случайные числа - morfizm


Aug. 1st, 2018 02:50 am Человек не умеет придумывать случайные числа

Предлагаю проверить тезис из заголовка. Банальная штука, но может позабавить.

Загадайте число от 0 до 9, потом тыкните сюда.

Если бы человек придумывал настоящие случайные числа, то они были бы равновероятны.
Но он не умеет, поэтому какие-то числа будут встречаться намного чаще других.
Сейчас мы это проверим:

Чему равно ваше загаданное число?

0
5(10.2%)
1
4(8.2%)
2
2(4.1%)
3
3(6.1%)
4
9(18.4%)
5
2(4.1%)
6
2(4.1%)
7
9(18.4%)
8
8(16.3%)
9
5(10.2%)


В данном случае очень полезен репост, потому что чем больше статистики соберём, тем интереснее будет результат.




Update: https://morfizm.livejournal.com/1216157.html
 

27 comments - Leave a commentPrevious Entry Share Next Entry

Comments:

From:dennyrolling
Date:August 1st, 2018 02:44 pm (UTC)
(Link)
я думаю что просто случайные числа норм, вот с последовательностью случайных чисел обычно проблемы.

я напечатал

011000110110010111010010100100010000010111010001001010101100110100111010101

или

011010100111111110000001100100001001011111001000110111001100101011110011100

?
From:morfizm
Date:August 1st, 2018 03:26 pm (UTC)
(Link)
Ты напечатал первое. Там аномально много 010 и аномально мало 111.

s = ...
b = collections.defaultdict(lambda :0)
for i in range(len(s)-2): b[s[i:i+3]] += 1
print sorted(b.items())

[('000', 6), ('001', 10), ('010', 15), ('011', 8), ('100', 10), ('101', 13), ('110', 8), ('111', 3)]

[('000', 7), ('001', 10), ('010', 8), ('011', 9), ('100', 11), ('101', 6), ('110', 9), ('111', 13)]

Впрочем, заметь, в людских случайных числах в моём тесте пока что ни одной пятёрки за 26 человек. Let's keep watching.

Edited at 2018-08-01 03:27 pm (UTC)
From:dennyrolling
Date:August 1st, 2018 03:32 pm (UTC)
(Link)
чувствую надо еще тренироваться :)
From:morfizm
Date:August 1st, 2018 03:36 pm (UTC)
(Link)
Вспоминай номера телефонов и бери чётность суммы цифр :)
Если потренироваться, это можно делать быстро!
From:dennyrolling
Date:August 1st, 2018 03:42 pm (UTC)
(Link)
меня больше интересует именно (псевдо)случайная способность печатать не думая про это специально.

для лулзов я мог две строчки питоном нагенерить :)
From:morfizm
Date:August 1st, 2018 03:45 pm (UTC)
(Link)
Это интересно... Научиться прислушиваться к какому-то случайному процессу в организме, оцифровывать его и брать хэш?

Боюсь, п росто "автоматизм" (мышечная память) тебе не поможет.
From:dennyrolling
Date:August 1st, 2018 03:56 pm (UTC)
(Link)
хешировать необязательно. в монетке нет никакого хеша, а работает нормально, надо просто подобрать случайный процесс.
From:morfizm
Date:August 1st, 2018 03:59 pm (UTC)
(Link)
Хэшировать не обязательно это только если результат процесса напрямую маппится в множество полезных исходов. Это редкость.
From:morfizm
Date:August 1st, 2018 03:37 pm (UTC)
(Link)
Ну или имена людей и чётность суммы ascii-кодов :)
From:morfizm
Date:August 1st, 2018 03:39 pm (UTC)
(Link)
Кстати, я думаю, если бы я не просил сначала задумать число, а сразу бы выкатил опрос с номерами, типа, тыкните в случайное, было бы намного больше перекоса. Никто бы не тыкал в первое и последнее, напр. Надо будет сделать отдельно тест.
From:dennyrolling
Date:August 1st, 2018 03:56 pm (UTC)
(Link)
а теперь чуть посложнее:

одно число из интервала 1-6 придумал я, а другое было сгенерировано с помощью честного генератора случайных чисел:

2 или 4?
From:morfizm
Date:August 1st, 2018 03:59 pm (UTC)
(Link)
Ты придумал 4.
From:dennyrolling
Date:August 1st, 2018 04:00 pm (UTC)
(Link)
подсказка: https://xkcd.com/221/
From:morfizm
Date:August 1st, 2018 04:01 pm (UTC)
(Link)
)))
From:morfizm
Date:August 1st, 2018 04:04 pm (UTC)
(Link)
Короче, я теперь знаю, какое случайное число из 0-9 нужно загадывать, чтобы всех удивить. Надо загадывать 5 :)

Edited at 2018-08-01 04:04 pm (UTC)
From:morfizm
Date:August 1st, 2018 04:01 pm (UTC)
(Link)
(конечно, суть не в том, угадаю я или нет, а в том, буду ли я статистически значимо чаще угадывать при большом количестве экспериментов)
From:rezkiy
Date:August 1st, 2018 10:25 pm (UTC)
(Link)
что-то мне моя интуиция говорит что это вполне вероятный исход. Выберем одно какое-то число (например 5). Веротяность что его ни разу не выберут это (9/10)^26 -- а это аж 6%. Ну чисел-то у нас 10, так что вероятность невыбора какого-то из 10 почти в 10 раз больше.
From:morfizm
Date:August 1st, 2018 10:41 pm (UTC)
(Link)
Да, я думал об этом. Когда если/будет не 26, а 50, то будут те самые заветные 5% :)

P.S. Minor nit: you're double-counting cases when more than one number was never chosen. Впрочем, думаю, что это влияет лишь незначительно.
From:rezkiy
Date:August 6th, 2018 05:43 pm (UTC)
(Link)
Учимся читать:

>> чисел-то у нас 10, так что вероятность невыбора какого-то из 10 почти в 10 раз больше.
From:morfizm
Date:August 6th, 2018 05:44 pm (UTC)
(Link)
Надо же, не заметил "почти". Sorry.
From:morfizm
Date:August 1st, 2018 11:36 pm (UTC)
(Link)
Чёрт! Добавили пятёрку :)
From:morfizm
Date:August 2nd, 2018 03:33 pm (UTC)
(Link)
Теперь надо будет другое считать: с какой вероятностью из 44 выборов будет целых 9 семёрок :) (ну или любых других отдельно взятых исходов).
From:rezkiy
Date:August 6th, 2018 05:48 pm (UTC)
(Link)
Это проще на питоне.

Ты в универе статистику прогуливал?
From:morfizm
Date:August 6th, 2018 05:53 pm (UTC)
(Link)
Ну я на питоне и посчитал, только в следующем посте.

Да, а откуда ты знаешь?
У нас действительно была слабая статистика в универе. Был только один обзорный курс, 2 кредита, и там был препод, который сам плохо понимает свой предмет. А меня в то время интересовала линейка и дискретка, поэтому факультативно я ничего не делал по статистике. Теперь не знаю, как наверстать. Если посоветуешь что-нибудь простое, связывающее школьный уровень с уровнем "могу читать книжки по теории вероятностей и статистике", буду признателен. Сходу эти книжки не читаются, опускаются руки продираться через обозначения.

Мой интерес на сегодня - это научиться руками считать confidence intervals для посчитанных метрик, считать p-value для результатов A/B теста, и делать какой-нибудь полезный math с распределениями вероятностей.
From:rezkiy
Date:August 6th, 2018 06:41 pm (UTC)
(Link)
Линейка это первый курс, статистика -- третий. Они не одновременно. Линейка не требует предварительных знаний.


Ты матан и теорвер более-менее знаешь?
From:morfizm
Date:August 6th, 2018 06:58 pm (UTC)
(Link)
Ты не понял глубины падения :) У нас был один (!) 2-cr курс, который назывался "введение в теорию вероятностей и статистику". 2 кредита это 1 семестр по 1 паре в неделю. Это был единственный обязательный курс по этим двум темам, и он возможно был раньше, чем на третьему курсе. А из необязательных я выбирал только дискретку.

Я могу по пальцам пересчитать, что у меня было из непрерывки за весь универ:
*) Был матан и дифуры, довольно много по объёму (может, суммарно 10 кредитов или даже больше).
*) Были численные методы (2-4 кредитов).
*) Был предмет "математические модели в дифференциальных уравнениях" (2 кредита) - это был курс по выбору, но я его выбрал, т.к. он был клёвый. Мы рассчитывали в мат.пакете, строили графики, но, в основном, занимались моделированием и анализом - типа, осмысление бифуркационных точек и всё такое.
*) Был обзорный курс "введение в физику" (2 кредита), где для успешной сдачи хватало школьных знаний.

Считай, суммарно за 6 лет учёбы непрерывка занимала меньше 1 семестра.
Всё остальное была дискретка, линейка, теоретический computer science, и немеренная куча всего, что вытекает из этих вещей и ними связана

Из матана хорошо помню дифференцирование и пределы, плохо помню дифуры, ещё хуже помню интегрирование.
From:rezkiy
Date:August 6th, 2018 07:23 pm (UTC)
(Link)
Это не глубина падения, это отсутствие взлета.

Я пороюсь в направлении "статистика для экономистов" на курсере, мож найду чего.