[ /tv/ /rf/ /vg/ /a/ /b/ /u/ /bo/ /fur/ /to/ /dt/ /cp/ /oe/ /bg/ /ve/ /r/ /mad/ /d/ /mu/ /cr/ /di/ /sw/ /hr/ /wh/ /lor/ /s/ /hau/ /slow/ /gf/ /vn/ /w/ /ma/ /azu/ /wn/ ] [ Main | Settings | Bookmarks | Music Player ]

No.1803 Reply
File: stat.jpg
Jpg, 113.29 KB, 758×720 - Click the image to expand
edit Find source with google Find source with iqdb
stat.jpg
Доброе время суток.
Я приехал к вам учиться по обмену.
Мне требуется научный руководитель для написания дипломной работы по социологии.

Тема работы: Статистическое исследование населения анонимного портала iichan.ru.

Предварительная постановка задачи:
1. Выбор внешнего сервиса для перехвата кликов с получением максимального количества личных данных
2. Длительный сбор данных.
3. Написание программного средства анализа полученных профилей с дальнейшим превращением в простой для манипуляции формат.
4. Составление профилей посетителей.

Направление дальнейших исследований:
  • Сопоставление данных профилей с профилями посетителей других анонимных сайтов, а также сравнение с профилями случайных пользователей сети интернет.
Текущее состояние работы:
1. В качестве средства перехвата нажатий выбран портал ЖЖ
2. Данные собираются в течение 4 месяцев, собрано 300 профилей.
3. Реализовано средство парсинга ЖЖ-профилей на базе языка python
4. Сейчас ведутся работы над составлением всяких красивых диаграмок.

Планируется написание работы в pdf-формате и её публикация в интернетах, возможна защита в качестве дипломного проекта Университета Доброчана.

Социологи-куны, просьба откликнуться. Капча в тему - убого сможем.
>> No.1806 Reply
ап
>> No.1807 Reply
File: ii.bmp
Bmp, 453.74 KB, 593×261
edit Find source with google Find source with iqdb
ii.bmp
File: 1803.png
Png, 1.22 KB, 200×20
edit Find source with google Find source with iqdb
1803.png

Зачем ты следишь за мной?
>> No.1809 Reply
>>1807 Ожидаемый ответ. Если вы считаете себя лишним в собранной выборке - сообщите об этом и я исключу вас.

Но все-таки, хотелось бы получить комментарии от социологов - какие соотношения каким образом правильно визуализировать (пироги, линии, тренды. столбики, ...)? Какие графики было бы интересно построить? Какие гипотезы имеет смысл проверить?
>> No.1810 Reply
File: 86ee96ed7df7cd0add2256df28d6b2308fca6ade.jpg
Jpg, 95.12 KB, 500×500 - Click the image to expand
edit Find source with google Find source with iqdb
86ee96ed7df7cd0add2256df28d6b2308fca6ade.jpg
ок, мм, ну я не социолог, так что мало что могу посоветовать. впрочем сейчас прикину, статистику я все таки учил.

очевидное, тебе необходимо взять и проверить нормальность распределения, например с помошью критерия пирсона. как им пользоваться легко найди в гугле, тут я не спец, всю конкретную математику я забыл, это надо смотреть учебник

самая его суть - он тебе покажет является ли распределение определенных признаков (например женат аноним или нет, старше 20 лет или нет, мальчик или девочка, богатый или бедный, общительный или нет и т.п.) в выборке случайным (т.е. "нормальным")или нет. если ты выберешь ряд таких признаков и проверишь их критерием пирсона (или другим подобным) это будет более чем достаточно на полноценную статью т.к. ты покажешь характерные черты анонима ычана, те которые не являются случайным совпадением
>> No.1815 Reply
File: 1200092024699.jpg
Jpg, 40.57 KB, 494×700 - Click the image to expand
edit Find source with google Find source with iqdb
1200092024699.jpg
>>1810 хех, чтобы проверять нормальность распределения, надо сначала сделать 2 вещи:
  • определиться с тем, какие именно характеристики исследуются (пример: возраст)
  • определиться с проверяемой гипотезой распределения величины (пример: нормальное распределение)
Хотелось бы получить побольше идей о том, что именно можно исследовать.

У меня имеются следующие данные:
Для всех:
  • (даты) Даты создания и последнего обновления ЖЖ
  • (числа) Количество написанных постов, количество оставленных и полученных комментов, использованных юзерпиков, тэгов, меморизов, картинок в альбоме ЖЖ
  • (категориальные) Тип журнала
  • (списки) интересы, френды, сообщества
Для некоторых:
  • (дата) Дата рождения (для половины пользователей)
  • (категориальные) Страна, регион, город, места учебы и для каждого также страна, регион, город.
  • (категориальные: y/n) ICQ, mail, website, lastfm, jabber, msn, aim, gizmo, google-talk, skype, yahoo, lj-jabber
Что из этого и как можно анализировать? Какие гипотезы применять к каким полям? Равноправны ли 0 и не-0 в числовых полях или их имеет смысл рассматривать отдельно? Можно ли что-то интересное узнать из графа взаимной дружбы? Какие величины имеет смысл проверить на корреляцию? Имеет ли смысл собрать еще какие-нибудь данные?
>> No.1816 Reply
File: 12.JPG
Jpg, 19.91 KB, 503×427 - Click the image to expand
edit Find source with google Find source with iqdb
12.JPG
>> No.1817 Reply
File: 1241007064463.jpg
Jpg, 20.07 KB, 503×427 - Click the image to expand
edit Find source with google Find source with iqdb
1241007064463.jpg
>> No.1818 Reply
>>1817
ну я просто давно там не был.
>> No.1819 Reply
>>1817
Колоночку голубую уберите. Они отсюда выкинуты на ичан той колонкой, что справа от них, и заолняют там собой самую правую колонку.
>> No.1820 Reply
>>1815
> определиться с тем, какие именно характеристики исследуются (пример: возраст)
> определиться с проверяемой гипотезой распределения величины (пример: нормальное распределение)
мм, в чем проблема? считай что ты только что определился.

по моему ты какой то фигней в этом треде занимаешся. все данные которые у тебя есть проверь на нормальное распределение и все, этого хватит. какие там графы и прочая лажа. для тех для кого есть дата рождения проверь возрастнополовой состав на нормальное распределение, половина это больше сотни, вполне достаточно, регионы, теги, интересы, друзей и сообщества на нормальное распредление (придумай, пронумеруй из например) и т.п.
>> No.1824 Reply
>>1820 На оп-картинке виднеется график распределения годов рождения. Он не описывается нормальным распределением.

Однако, если я сгруппирую года парами, (... 1985-86, 1987-88, 1989-90 и т.п.), то должно будет выровняться по идее.

Корректно ли такое действие, когда я говорю о выборке около сотни человек, а диапазон возрастов в основе своей лежит в 1980-1992???
>> No.1827 Reply
>>1817
А ты сам унылое небыдло или баттхертнутый беженец?
>> No.1830 Reply
> Корректно ли такое действие, когда я говорю о выборке около сотни человек, а диапазон возрастов в основе своей лежит в 1980-1992???
таким макаром ты намеренно понижаешь точность теста. зачем?

алсо я надеюсь что ты понимаешь что доказав что распределение не нормальное ты можешь смело утверждать что существует перекос в ту сторону кого в твоей выборке больше всего, т.е. он и так существует но теперь ты знаешь что он не случаен а вызван привлекательностью ычана для этой категории людей
>> No.1838 Reply
>>1830 Неожиданность в том, что у полученного распределения 2 пика, т.е. оно похоже на сумму двух нормальных:
  • интенсивного, с максимумом в районе 1987
  • менее мощного, с максимумом в районе 1983
Очень жалею, что нет статистики о населении Ичана до падения Два.ча, есть подозрение, что добавочное распределение - один из лагерей беженцев с Усопшего.
>> No.1839 Reply
>>1838
> есть подозрение, что добавочное распределение - один из лагерей беженцев с Усопшего.
вот это имеешь ввиду?
> менее мощного, с максимумом в районе 1983
как "менее мощное" добавочным я могу назвать только его
>> No.1841 Reply
да, совсем забыл - ты не забудь сравнить возрастное распределение со средним по рунету. короче кури статистику, больше ничего сказать не могу
>> No.1845 Reply
File: nhk_01.jpg
Jpg, 177.40 KB, 1006×1024 - Click the image to expand
edit Find source with google Find source with iqdb
nhk_01.jpg
>>1815
по этим данным можно:
считать средние значения. тогда можно проверить гипотезу, правда ли анону 20 лет и он бородат.
качественные данные переводи в количественные, допустим, интерес "аниме" встречается у n анонов.
можно считать взаимосвязь между наличием (0/1) тех или иных интересов и количеством френдов, например.
алсо, можно из пункта "числа) Количество написанных постов, количество оставленных и полученных комментов, использованных юзерпиков, тэгов, меморизов, картинок в альбоме ЖЖ" сделать некую общую характеристику и ранжировать по ней всех, группировать, строить диаграммы.

типы диаграмм выбраны правильные, ибо пространственная выборка.

алсо, хотеть себе данные, погонять.
>> No.1847 Reply
>>1845 Капча "опрятны лицом" ставит под сомнение бородатость.
>> No.1906 Reply
>>1845
> алсо, хотеть себе данные, погонять.
Ну напиши свой парсер ЖЖ и играйся, данные-то все открытые - только собрать надо.
>> No.1966 Reply
куда кстати оп пропал? там слона ха это время рассчитать можно не то что пару тройку критериев. где его работа?
>> No.1980 Reply
File: 1242469246474.jpg
Jpg, 76.38 KB, 1046×659
edit Find source with google Find source with iqdb
1242469246474.jpg
File: 1242463950886.jpg
Jpg, 44.35 KB, 799×504
edit Find source with google Find source with iqdb
1242463950886.jpg

>>1966 Зарылся в дела. Совершенно не до всего этого.
Но как разгребу дела, обязательно опубликую результаты тут.
Кстати, тут на Ичане социологический тред как раз в тему произошел, удалось сравнить результаты с реальным опросником. Аномальный провал посещаемости в районе 24 лет подтвердился. Я не знаю как это трактовать.
>> No.1981 Reply
>>1980
Очевидно же. Анон заканчивает университет, уходит с головой в открывшуюся новую жизнь, заново ищет свое место в мире: на интернеты времени не остается. Постепенно ситуация стабилизируется, анон успокаивается и вспоминает про имиджборды.
>> No.1982 Reply
>>1980
> Аномальный провал посещаемости в районе 24 лет подтвердился. Я не знаю как это трактовать.
самое очевидное -- 24-летних людей может просто быть меньше на данный момент, чем остальных. в разные годы может быть разная рождаемость. к прискорбию, по госстатовским таблицам это не проверишь, т.к. там разбивка возрастных групп по 4 года -- http://www.gks.ru/bgd/regl/b08_11/IssWWW.exe/Stg/d01/05-02.htm
>> No.1984 Reply
>>1981 Университет оканчивают чуть раньше, в районе 22 лет.
c: секунда поезда
>> No.2030 Reply
File: 1803.png
Png, 1.44 KB, 200×20 - Click the image to expand
edit Find source with google Find source with iqdb
1803.png
>>1984 Не все получают высшее образование с первой попытки. Среди битардов, как по мне, процент в то или иное время отчисленных должен быть высок. Капча как бы смеется надо мной.
2 раза отчислен-кун
>> No.2077 Reply
>>2030 Думаешь, анонимусы в большинстве своем неудачники?
капча: нанесло двачетян
>> No.2082 Reply
>>2077 Думаю, что психически здоровые люди старше школьного возраста на имиджбордах практически не оседают. Что-то должно сильно обидеть их в прошлом. Отчисление из университета - вполне себе повод. "Здесь-то я начну блистать своим непризнанным интеллектом! Не прощая и не забывая." Да, пожалуй для этого употребляется термин "батхерт", в котором на отдельных тематических досках принято уличать каждого первого.
>> No.2091 Reply
Как продвигается ваше ретроспективное исследование?
>> No.2131 Reply
>>2091 У меня скоро наконец появится на него свободное время. Только вот объекта исследования не стало и как бы работа не стала исторической вместо социологической.
>> No.2167 Reply
>>1803
> В качестве средства перехвата нажатий выбран портал ЖЖ
ОП, расскажи, пожалуйста, поподробнее, как ты устроил перехват кликов на iichan.ru с фиксацией ЖЖ-аккаунта?
>> No.2183 Reply
> В качестве средства перехвата нажатий выбран портал ЖЖ
В итоге имеем статистику только по юзерам, пользующимся Ычаном и ЖЖ одновременно.
Алсо, после того, как ты меня посчитал, я отключил учёт статистики.
>> No.2184 Reply
>>2183
А я его зафрендил :3
>> No.2186 Reply
>>2183 А смысл? Во френды уже добавили ведь. Даже локальную копию профиля сняли, чтоб анализировать без обращений к серверу. Или опасаешься повторного раскрытия профиля другому анонимусу?
>> No.2199 Reply
>>2186
Просто я особо не пользовался ЖЖ и не знал, что там есть такая фича. Профиль почти пустой, аккаунт только чтобы писать комменты. Отключил для предотвращения подобных случаев в будущем.
>> No.4477 Reply
File: 125342571149087.pdf
Pdf, 1.67 KB, 595×842 - Click the image to get file
125342571149087.pdf
pdf related
>> No.4521 Reply
File: 125208555708019.jpg
Jpg, 30.23 KB, 346×319
Your censorship settings forbid this file.
unrated
>>4477
Гуд уок, бро.
>> No.4559 Reply
>>4477
Perfect!
>> No.4567 Reply
>>4477 - related, но не связана с ОП-постом, если что.


Password:

[ /tv/ /rf/ /vg/ /a/ /b/ /u/ /bo/ /fur/ /to/ /dt/ /cp/ /oe/ /bg/ /ve/ /r/ /mad/ /d/ /mu/ /cr/ /di/ /sw/ /hr/ /wh/ /lor/ /s/ /hau/ /slow/ /gf/ /vn/ /w/ /ma/ /azu/ /wn/ ] [ Main | Settings | Bookmarks | Music Player ]