Анализ сетевой структуры сообществ в Петрозаводске

Как работа Точки кипения влияет на связи между людьми и сообществами? На примере Петрозаводской ТК рассматриваем, как пересекаются между собой участники разных мероприятий, и оцениваем эффективность работы Точки.

Как измерить эффективность работы Точки кипения? Есть ли объективные метрики, которые можно было бы применять для измерения «сгущения» сообществ? Таким вопросом мы задались после программы «Остров 10-21», которая проходила в Дальневосточном федеральном университете, в котором есть своя Точка кипения.

Для анализа мы взяли открытую в 2016 году Точку кипения в Петрозаводске: она также развивается при непосредственном участии команды Петрозаводского государственного университета (то есть по формату является университетской Точкой кипения), располагается в столице региона, но при этом находится «в тени» другой Точки кипения –Санкт-Петербурга. Мы решили проверить, как изменилась (и изменилась ли) связанность людей благодаря работе Точки.

Для этого мы решили воспользоваться методом сетевого анализа. Мы взяли все мероприятия, которые проходили в Точке с момента ее открытия, и посмотрели, как пересекаются между собой их участники (под пересечениями мы считали факт присутствия на одном мероприятии).

Для анализа было взято 217 мероприятий (было решено удалить два мероприятия из-за выброса количества участников по сравнению со средним значением), с общим количеством участников в 3563 человека и 5962 посещениями (то есть посещения мероприятий были не уникальными: есть участники, которые посещали несколько мероприятий).

Мы применили метод 2-mode-graph, чтобы построить affiliation network. Мы считали, что между двумя участниками есть связь, если они были на одном мероприятии. Всего таких связей было 338, причем:

  1. Около 91% всех участников мероприятий пересекаются друг с другом, то есть находятся в состоянии связанности
  2. 337 человек не связаны ни с кем, то есть они не пересекались с другими участниками на мероприятиях.

https://admin.leader-id.ru/upload/file/get/f8c206/" style="width: 168px; height: 128px;" />

Далее мы удалили из выборки мероприятия с численностью участников «0» и «1» (которые могли возникнуть из-за ошибки фиксации участников или из-за отмены мероприятия в виду отсутствия интереса к нему). Осталось 171 мероприятие, количество участников которых варьировалось от 2-х до 254 человек.

https://admin.leader-id.ru/upload/file/get/b3b70c/" style="width: 400px; height: 246px;" />

https://admin.leader-id.ru/upload/file/get/b2db41/" style="width: 576px;" />

Два графика выше показывают, как распределились мероприятия по численности участников, а также как варьировалась численность участников мероприятий в зависимости от направления мероприятий. В целом малочисленных событий в Точке кипения Петрозаводска больше, чем средне- и многочисленных.

Квартили мероприятий после удаления событий с количеством участников «0» и «1» выглядят так, как показано в таблице:

0%

25%

50%

75%

100%

2

8

20

41.5

254

Разделим все события по категориям в зависимости от количества участников в соответствии с этой таблицей. Будем считать, что:

  • 2-8 человек – маленькое мероприятие
  • 8-20 человек – среднее мероприятие
  • 20-41 человек – большое мероприятие.
  • 42-254 человека – очень большое мероприятие.

Далее сделаем предположение. Сила связи между участниками мероприятия зависит

от количества людей на этом мероприятии. Чем больше людей – тем меньше сила связи. Потому что на большом мероприятии шанс поговорить с каждым человеком – меньше, чем на маленьком мероприятии, где все друг друга знают или легко знакомятся. Сделав это предположение, мы оставили в выборке только мероприятия, численность которых не превышала 20 человек (то есть только маленькие и средние мероприятия). Сеть участников этих мероприятий представлена на рисунке ниже:

https://leader-id.ru/upload/file/get/a9f315/" style="width: 288px; height: 222px;" />

Количество участников этой сети – 414 человек, что гораздо меньше, чем в первом случае, когда мы брали в расчет все мероприятия (3563 участников).

Оставим в нашем списке событий только «маленькие» мероприятия, на которых присутствует 2-8 человек. На таких встречах все знакомы между собой, а значит сила связей между такими участниками – максимальна. Так выглядит сеть из участников «маленьких» мероприятий:

https://leader-id.ru/upload/file/get/f35420/" style="width: 270px; height: 209px;" />

В данной сети присутствует 108 человек, что в 4 раза меньше, чем в предыдущем случае. Здесь мы уже видим несколько отсоединенных компонентов (то есть связанных участников между собой, которые не включены в общую сеть).

Сделаем второе предположение: сообщества объединяются вокруг определенной темы, поэтому далее продолжим исследование по направлениям, которым соответствовали мероприятия. Топ-3 направлений – «Социальные проекты» (77 мероприятий), «Развитие регионов» (39 мероприятий) и «Молодые профессионалы» (21 мероприятие). Взглянем на структуру сети участников этих мероприятий, не забывая о том, что мы берем в расчет только те мероприятия, на которых было не более 20 человек, то есть «маленькие» и «средние» (таких мероприятий у «Социальных проектов» было 44, у «Развития регионов» - 18, у «Молодых профессионалов» - 10).

https://leader-id.ru/upload/file/get/b22d09/" style="width: 243px; height: 188px;" />

Структура сети сообщества по направлению «Социальные проекты» (176 человек)

https://leader-id.ru/upload/file/get/c56147/" style="width: 226px; height: 174px; float: left;" />

Структура сити сообщества по направлению «Развитие регионов» (93 человека). Версия 1

https://leader-id.ru/upload/file/get/82daea/" style="width: 229px; height: 177px; float: left;" />

Структура сити сообщества по направлению «Развитие регионов» (93 человека). Версия 2. Та же самая сеть представлена методом Kamada-Kawai – плотность связей и их количество учитывается при рисовании сети. Компоненты с плотной связанностью и большим количеством внутренних связей – находятся на рисунке ближе, как будто каждая связь между узлами – стягивающаяся резинка.

https://leader-id.ru/upload/file/get/b41b7e/" style="width: 221px; height: 171px;" />

Структура сити сообщества по направлению «Молодые профессионалы» (129 человек).

На этом рисунке хорошо видно, как участники разделились на 9 плотных компонентов – или 9 под-сообществ.

Рассмотрим граф «Молодые профессионалы» внимательнее. Для этого раскрасим каждый кластер в свой цвет и нанесем значение линий, которое отражает, сколько совместных мероприятий посетили участники. Линия между двумя точками равна 1, значит они посетили одно мероприятие.

https://leader-id.ru/upload/file/get/b09d75/" style="width: 255px; height: 197px;" />

Как видно на рисунке, большинство линий имеют значение 1, и группируются по этому признаку в группу (то есть это участники, которые посетили совместно только одно мероприятие). Но некоторые точки связаны между собой линией со значением «2» (7 линий). Таки точки находятся ближе друг к другу. Чем больше таких точек, тем ближе они к центру.

https://admin.leader-id.ru/upload/file/get/93d233/" style="width: 468px; height: 360px; float: left;" />

Снова расширим выборку и включим в нее мероприятия направления «Молодые профессионалы», которые относятся к большим (до 40 человек) по числу участников (15 мероприятий, общее количество участников - 254 человека).

Разобьем граф на «под-сообщества» методом VOS Clustering:

https://admin.leader-id.ru/upload/file/get/830d67/" style="width: 583px; height: 449px; float: left;" />

Граф стал а) больше и б) более «округлым» (то есть выровнялось количество связей). При этом точки, раскрашенные красным цветом, слабо связаны с общей сетью.

Добавив крупные мероприятия с количеством участников более 40 (21 мероприятие, 715 участников), мы получим новый граф для участников сообщества «Молодые профессионалы» в Петрозаводске:

https://admin.leader-id.ru/upload/file/get/427534/" style="width: 300px; height: 231px;" />

На больших мероприятиях связь между участниками более слабая, так как вероятность пересечься, познакомиться, запомнить друг друга и пообщаться меньше. Поэтому для измерения силы связи между людьми, принявшими участие в одном крупном мероприятии, предлагаются следующие способы:

  1. Линейный. Сила связи измеряется по формуле 1/n, где n – это количество участников этого события. Например, если А и Б оба приняли участие в трех событиях, где было 5, 20 и 100 человек, то сила их связи = 1/5+1/20+1/100=0.2+0.05+0.01=0.26.
  2. Квадратный. Сила связи измеряется по формуле 1/ n^

На рисунке показана «взвешенная сеть». Размер точек – Degree Centrality каждого узла, цвет точки – к какому кластеру он принадлежит, по методу VOS clustering.

https://admin.leader-id.ru/upload/file/get/cc624c/" style="width: 489px; height: 404px; float: left;" />

Что нам дало исследование? Мы выяснили:

  • Что общая связанность сети участников мероприятий в Петрозаводске достаточно высокая.
  • Какие участники пересекаются между собой чаще всего (то есть образовывают устойчивые связи).
  • Через каких участников проходит наибольшее количество информации в сети (то есть кто посещает наибольшее количество мероприятий).
  • Какие участники пока не являются частью сообщества, то есть не включены в сеть.
  • Кто является действующим или потенциальным лидером мнения в сообществе.
  • Какова особенность структуры сообществ, относящихся к разным тематикам.

Исследование подготовил участник программы «Остров 10-21» Константин Горцевский при участии научного консультанта Елизаветы Черненко.