Анализ сетевой структуры сообществ в Петрозаводске

7 ноября 2018 г.

Как измерить эффективность работы Точки кипения? Есть ли объективные метрики, которые можно было бы применять для измерения «сгущения» сообществ? Таким вопросом мы задались после программы «Остров 10-21», которая проходила в Дальневосточном федеральном университете, в котором есть своя Точка кипения.

 Для анализа мы взяли открытую в 2016 году Точку кипения в Петрозаводске: она также развивается при непосредственном участии команды Петрозаводского государственного университета (то есть по формату является университетской Точкой кипения), располагается в столице региона, но при этом находится «в тени» другой Точки кипения –Санкт-Петербурга. Мы решили проверить, как изменилась (и изменилась ли) связанность людей благодаря работе Точки.

 Для этого мы решили воспользоваться методом сетевого анализа. Мы взяли все мероприятия, которые проходили в Точке с момента ее открытия, и посмотрели, как пересекаются между собой их участники (под пересечениями мы считали факт присутствия на одном мероприятии).

 Для анализа было взято 217 мероприятий (было решено удалить два мероприятия из-за выброса количества участников по сравнению со средним значением), с общим количеством участников в 3563 человека и 5962 посещениями (то есть посещения мероприятий были не уникальными: есть участники, которые посещали несколько мероприятий).

 Мы применили метод 2-mode-graph, чтобы построить affiliation network. Мы считали, что между двумя участниками есть связь, если они были на одном мероприятии. Всего таких связей было 338, причем:

  1. Около 91% всех участников мероприятий пересекаются друг с другом, то есть находятся в состоянии связанности
  2. 337 человек не связаны ни с кем, то есть они не пересекались с другими участниками на мероприятиях.

 

 Далее мы удалили из выборки мероприятия с численностью участников «0» и «1» (которые могли возникнуть из-за ошибки фиксации участников или из-за отмены мероприятия в виду отсутствия интереса к нему). Осталось 171 мероприятие, количество участников которых варьировалось от 2-х до 254 человек.

 

 

 

 

Два графика выше показывают, как распределились мероприятия по численности участников, а также как варьировалась численность участников мероприятий в зависимости от направления мероприятий. В целом малочисленных событий в Точке кипения Петрозаводска больше, чем средне- и многочисленных.

Квартили мероприятий после удаления событий с количеством участников «0» и «1» выглядят так, как показано в таблице:

0%

25%

50%

75%

100%

2

8

20

41.5

254

 

Разделим все события по категориям в зависимости от количества участников в соответствии с этой таблицей. Будем считать, что:

  • 2-8 человек – маленькое мероприятие
  • 8-20 человек – среднее мероприятие
  • 20-41 человек – большое мероприятие.
  • 42-254 человека – очень большое мероприятие.

 

Далее сделаем предположение. Сила связи между участниками мероприятия зависит

от количества людей на этом мероприятии. Чем больше людей – тем меньше сила связи. Потому что на большом мероприятии шанс поговорить с каждым человеком – меньше, чем на маленьком мероприятии, где все друг друга знают или легко знакомятся. Сделав это предположение, мы оставили в выборке только мероприятия, численность которых не превышала 20 человек (то есть только маленькие и средние мероприятия). Сеть участников этих мероприятий представлена на рисунке ниже:

 

 

Количество участников этой сети – 414 человек, что гораздо меньше, чем в первом случае, когда мы брали в расчет все мероприятия (3563 участников).

Оставим в нашем списке событий только «маленькие» мероприятия, на которых присутствует 2-8 человек. На таких встречах все знакомы между собой, а значит сила связей между такими участниками – максимальна. Так выглядит сеть из участников «маленьких» мероприятий:

 

 

В данной сети присутствует 108 человек, что в 4 раза меньше, чем в предыдущем случае. Здесь мы уже видем несколько отсоединенных компонентов (то есть связанных участников между собой, которые не включены в общую сеть).

Сделаем второе предположение: сообщества объединяются вокруг определенной темы, поэтому далее продолжим исследование по направлениям, которым соответствовали мероприятия. Топ-3 направлений – «Социальные проекты» (77 мероприятий), «Развитие регионов» (39 мероприятий) и «Молодые профессионалы» (21 мероприятие). Взглянем на структуру сети участников этих мероприятий, не забывая о том, что мы берем в расчет только те мероприятия, на которых было не более 20 человек, то есть «маленькие» и «средние» (таких мероприятий у «Социальных проектов» было 44, у «Развития регионов» - 18, у «Молодых профессионалов» - 10).

 

 

 

Структура сити сообщества по направлению «Социальные проекты» (176 человек)

 

 

 

 

 

 

 

Структура сити сообщества по направлению «Развитие регионов» (93 человека). Версия 1

 

 

 

 

 

 

 

Структура сити сообщества по направлению «Развитие регионов» (93 человека). Версия 2. Та же самая сеть представлена методом Kamada-Kawai – плотность связей и их количество учитывается при рисовании сети. Компоненты с плотной связанностью и большим количеством внутренних связей – находятся на рисунке ближе, как будто каждая связь между узлами – стягивающаяся резинка.

 

 

Структура сити сообщества по направлению «Молодые профессионалы» (129 человек).

На этом рисунке хорошо видно, как участники разделились на 9 плотных компонентов – или 9 под-сообществ.

Рассмотрим граф «Молодые профессионалы» внимательнее. Для этого раскрасим каждый кластер в свой цвет и нанесем значение линий, которое отражает, сколько совместных мероприятий посетили участники. Линия между двумя точками равна 1, значит они посетили одно мероприятие.

 

 

Как видно на рисунке, большинство линий имеют значение 1, и группируются по этому признаку в группу (то есть это участники, которые посетили совместно только одно мероприятие). Но некоторые точки связаны между собой линией со значением «2» (7 линий). Таки точки находятся ближе друг к другу. Чем больше таких точек, тем ближе они к центру.

 

 

 

 

 

 

 

 

 

 

 

 

 

Снова расширим выборку и включим в нее мероприятия направления «Молодые профессионалы», которые относятся к большим (до 40 человек) по числу участников (15 мероприятий, общее количество участников - 254 человека).

 

Разобьем граф на «под-сообщества» методом VOS Clustering:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Граф стал а) больше и б) более «округлым» (то есть выровнялось количество связей). При этом точки, раскрашенные красным цветом, слабо связаны с общей сетью.

Добавив крупные мероприятия с количеством участников более 40 (21 мероприятие, 715 участников), мы получим новый граф для участников сообщества «Молодые профессионалы» в Петрозаводске:

 

 

На больших мероприятиях связь между участниками более слабая, так как вероятность пересечься, познакомиться, запомнить друг друга и пообщаться меньше. Поэтому для измерения силы связи между людьми, принявшими участие в одном крупном мероприятии, предлагаются следующие способы:

  1. Линейный. Сила связи измеряется по формуле 1/n, где n – это количество участников этого события. Например, если А и Б оба приняли участие в трех событиях, где было 5, 20 и 100 человек, то сила их связи = 1/5+1/20+1/100=0.2+0.05+0.01=0.26.
  2. Квадратный. Сила связи измеряется по формуле 1/ n^

 

На рисунке показана «взвешенная сеть». Размер точек – Degree Centrality каждого узла, цвет точки – к какому кластеру он принадлежит, по методу VOS clustering.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Что нам дало исследование? Мы выяснили:

  • Что общая связанность сети участников мероприятий в Петрозаводске достаточно высокая.
  • Какие участники пересекаются между собой чаще всего (то есть образовывают устойчивые связи).
  • Через каких участников проходит наибольшее количество информации в сети (то есть кто посещает наибольшее количество мероприятий).
  • Какие участники пока не являются частью сообщества, то есть не включены в сеть.
  • Кто является действующим или потенциальным лидером мнения в сообществе.
  • Какова особенность структуры сообществ, относящихся к разным тематикам.

 

Исследование подготовил участник программы «Остров 10-21» Константин Горцевский.