Итак, немного статистики от ёжика. Тред для препарирования был избран практически рандомно, первый относительно заполненный, который подвернулся под руку, поэтому наверняка не самый интересный:
>>674461. Треду чуть более чем 1.5 года, не такой старый, так что наверное, состав его не очень сильно отличается от сегодняшнего населения /rf. Конечно, с поправкой на т.н. self-selection bias - кто-то, например, принципиальный рид-онли и потому не отписался, кто-то просто не любит опросники. Это могло серьезно изменить картину (если, например, рид-онли куны более хикковаты в целом). Но, что есть, с тем и приходится работать.
Своего ответа в этом треде я тоже не встретил (а может, просто не узнал).
Базовая информация.
Всего имеем 81 заполненную анкету. Пикчи стронгли релейтед.
Средний возраст анона /rf 22.6 лет. Большая часть анонов в возрасте 18-22 лет. Все отписавшиеся аноны были в возрасте от 16 до 32 лет.
Средний доход анона составил 19.8 т.р. Меньше, чем в среднем по России (в 2014 что-то в районе 27к), но с учётом множества школьников и студентов, разница не такая уж и большая.
71% анонов признался, что не имеет тян. При этом напомню, что это не вопрос про девственность - многие аноны без тян говорили о 1 или более тянах в прошлом. 16% анонов сообщили что находятся в активном поиске тян, и еще 12% сказали, что тян у них есть.
Наличие друзей более распространено - 64% анонов сообщили о наличии хотя бы 1 друга. При этом регулярно появлялись непонятки относительно того, кого считать друзьями, а кого нет, поэтому пришлось иногда проявлять сорт оф экспертную оценку
:3 В плане образования - 32% анонов имеют среднее образования (сюда же я определял тех, кто не закончил высшее). Другие две объемные группы - студенты и аноны с высшим образованием, 20% и 28% соотвественно. Есть немного школьников и анонов со средним специальным. Нашёлся даже один кандидат технических наук.
Продвинутая статистика А теперь немного, собственно, математической статистики. В качестве первого исследования рассмотрим вопрос, который, несомненно, так волнует умы многих в /rf:
ПОЧЕМУ ЖЕ У МЕНЯ НЕТ ТЯН? Для исследования определим 3 бинарные переменные. 1я - это индикатор NEET. NEET = 1, если анон не является школьником или студентом и при этом сообщает об отсуствии работы. 2я - индикатор наличия друзей, значение 1 если у анона есть 1 или более друзей. И наконец, 3я - индикатор наличия тян. Назовём переменные N, F и T соответственно.
Сначала я проверил корреляции между каждой парой переменных. Тут никаких сюрпризов: корреляции N-F и N-T однозначно отрицательны (около -0.2); если вы NEET, то шансы иметь друзей или девушку существенно снижаются. Коррелляция F-T положительная (0.26): для анонов с друзьями более вероятно иметь тян.
Результаты регрессий более интересны. Я запилил несколько, расскажу только о двух самых результативных.
Первая это регрессия T на N, F и N*F. Да, я знаю, что делать линейные регрессии с бинарной зависимой переменной это рак и в приличном месте мне бы за такое намяли бы бока. Но возиться с логистической моделью мне лень.
Результат меня немного удивил, я несколько раз проверил, и до сих пор не уверен, что всё сделал как надо. Но получается, что влияние NEET на наличие тян почти идеально нулевое, в то время как влияние наличия друзей на наличие девушки статистически значимо на уровне 1%! То есть, причина, по которой NEET коррелирует с T - это потому что у NEET меньше друзей, но вовсе не из-за NEET как такового. В этом, конечно, есть очень много здравого смысла, но все равно результат выглядит черезчур уж сильным для такой маленькой выборки анонов.
Алсо, не будем забывать главную мантру статистики: "correlation is not causation". Хотя появляется исскушение сразу же заключить, что наличие друзей приводит к наличию тян, это может быть вовсе не так. Во-первых, зависимость может быть обратная. У анона появляется Мисаки, и она вытаскивает хикку на мороз, знакомит с людьми, социализирует, у него появляются. Во-вторых (и это более вероятный сценарий), может быть ситуация с некоторой (отсутствующей в наших данных) переменной, которая вызывает
одновременно и наличие у анона друзей и наличие девушки. Это может быть некий параметр "общительность". Или, если угодно, параметр "альфачество" (все-по-ПТП-куны ликуют: "А мы же говорили!"). Понять, что именно из этих 3х вариантов произошло, из нашей регрессии мы не можем. Люди пишут целые монографии, как получить причинно-следственную связь из статистической, такие методы есть, но всё это очень сложно и в нашем случае не применимо, поэтому мы просто двигаемся дальше.
Во второй регрессии я решил дополнительно проверить предыдущий результат, и теперь я сделал регрессию T на уровне дохода анона и F. Он, по сути, подтвердил предыдущий результат. Коэффициент F положителен и значим на уровне 5%. Доход тоже имеет положительный коэффициент, но он слишком близок к 0, и не значим ни на одном стандартном уровне.
tl;dr для наших данных, доход или формальная занятость (наличие работы/учебы) не влияют на шансы анона заиметь тян. Однако же наличие друзей и наличие тян связаны положительно, и весьма сильно.
Теперь второе исследование.
ВНН - ВЫШКА НЕ НУЖНА! Небольшое вступление. Одной из любимых тем экономистов является т.н. returns to education, то есть эффект высшего образования на зарплату. Рашка в плане образования довольно уникальное место. Она держится где-то на первых местах по проценту людей с высшим образованием. Во многом благодаря тому, что на западе чрезвычайно сложно получить образование бесплатно, да и заочки (которые как бы образование, но как бы и нет) там как-то не в ходу. И при этом, в России один из самых низких returns to education, по этому показателю мы соседствуем с такими гигантами мысли как Эфиопия, Афганистан и Венесуэла. В среднем, человек с высшим образованием получает в России на 5% больше, чем без него. Если смотреть только для кунов, то результат чуть повыше, 10-15%.
В общем, я и решил проверить, а как обстоят дела с этим в /rf. Моя исходная гипотеза в том, что тут с этим всё ещё хуже (из-за особенностей местного населения, а также из-за пары успешных бизнесменов без вышки в выборке). Ну собственно, так и вышло.
Я запилил регрессию дохода анона на его возрасте и на бинарной переменной V (которая =1 если анон закончил вуз). Она показала, что в среднем по выборке анонов 1 год возраста даёт анону 4.5к дополнительного дохода, при том что
наличие корочки даёт анону 1к дополнительного дохода. Эффект возраста значим на 1%, эффект высшего образования - разумеется, не значим.
Ладно, подумал я. Но это может быть потому, что у нас тут куча школьников и студентов. Они, очевидно, не имеют высшего образования, и в основном, не имеют дохода. Но ведь теоретически, после вуза они вполне могут найти работу. Давайте их исключим из выборки и попробуем ещё раз.
После этого результат стал ещё веселее. Теперь средний анон из выборки, закончив вышку, получает на
40, лол рублей
меньше дохода чем средний анон без вышки. Ну то есть по сути, корочка анону в этом плане абсолютно нихуя не даёт.
tl;dr Получать вышку в надежде на лучшее трудоустройство - для анонов /rf в среднем ещё более сомнительная затея, чем для россиян в целом (где и так, как бы, ниочень всё это).
На этом идеи, что можно ещё сделать с этими данными, иссякли. Возможно, в следующий раз разберу какой-нибудь другой опросник.
А может быть и нет