Мануал по social graph bot

Мануал по social graph bot



Вы наткнулись на необычного бота - @friendly_graph_bot, который изучает дружеские коллективы/группы конкретного человека с помощью социального графа, а также бот готов построить полный анализ на нужную страницу ВК.

А это один из графов по комментариям и лайкам на 35к человек с дипломной работы админа (общение под постами за некую неделю)

Зачем всё это? Изначально по приколу, но надеюсь, вы тут с благими намерениями

Оглавление

  1. Как читать свой граф и как он строится
  2. Полный анализ


Как читать свой граф и как он строится

Как изучить свой граф:
Если вы построили граф на свою страницу, то достаточно посмотреть на имена в каждом кластере, тогда будет понятно, где друзья с вуза/школы/работы/секции/родной деревни. Вот пример "моего" графа.

номера групп идут по убыванию участников


Но если решили узнать другого человека поближе, то имена не помогут, а наш "ультра-мега полный анализ 3000" раскроет все карты. Подробнее в главе полный анализ, где анализируется информация со страниц и подписки всех друзей.

Немного теории, понятной всем (можно пропустить)

  • Модулярность - это мера крутизны того, как мы разбиваем граф на группы. Чем сильнее кучкуются вершины внутри группы и меньше связок между группами, тем круче (ближе к 1) модулярность.
  • Разбиваем на кластеры (группы друзей):
    Чтобы найти группы друзей, используем алгоритм Лувена. Он оценивает разбиение по модулярности и старается сделать её максимальной. Короче говоря, ищет такое разделение, где связей внутри групп много, а между группами мало.
  • Размещаем точки:
    Изначально граф - это каша точек в случайном месте. Тут работает алгоритм, который считает вершины графа как частицы, которые тянутся и отталкиваются друг от друга. Если вершины связаны, они тянутся друг к другу, а если нет - отталкиваются.
    Алгоритм постоянно обновляет положение вершин, пока не найдет такое место, где все будут в равновесии.
Даже это пояснение написано с помощью ChatGPT, как и 80% кода бота. Добро пожаловать в новую эру.

Полный анализ

Если для графа достаточно выгрузить списки друзей каждого вашего друга, то в полном анализе выгружаются целиком страницы ваших друзей, вместе с их подписками, это занимает в 6 раз больше времени, поэтому такое удовольствие капельку платное, ведь двум студентам нужно оплачивать сервер и поддерживать 3к строчек говнокода.
Так вот, помимо графа, в полном анализе мы изучаем:

1) География

На страницах люди обычно указывают в разделе "город" свое нынешнее место жительства, "родной город" и так понятно. Учитывайте, что далеко не все указывают эту информацию на странице, поэтому можно судить по группе в целом по нескольким ее участникам.

Пример: Волгоград в "родном городе" указали 2 человека из зеленой группы, а на графике "город" эта зеленая группа разбрелась еще на Москву и Питер. Это одноклассники - кто-то поступил в столицы, многие остались. К аналогичному выводу можно прийти, анализируя "не себя".
Выводятся города, где хотя бы 2 человека с одной группы. Можно кликать по группам, чтобы смотреть нужные. Двойной клик - смотрим одну.

2) Лидеры групп

Здесь всё просто, ищем людей с наибольшим количеством связей внутри своей группы.

Кликаем на круг - видим имя

3) Возраст

Возраст разбит на группы и пол. На этом шаге можно идентифицировать группу, которую я описал как "родственники", ведь они попали в 40+


4) Анализ сообществ

На первом графике рассмотрены общие паблики. Сразу видно какое отношение данная группа имеет к анализируемому человеку
На втором круговая диаграмма типов сообществ ("юмор", "новости" итд). Это общие интересы группы по всем их подпискам (к примеру, у 10 человек по 100 подписок, на диаграмме учтены типы всех 1000 сообществ)
На третьем графике "топ слов" из названий сообществ. По большей части смысловая нагрузка пересекается с первым графиком, но

можно скролить графики, если столбцов очень много. При наведении доп. информация. Если не видно доп. инфу, подвинь график влево


Подписки информативнее всего описывают коллектив. Особое внимание на всякие "подслушано", ведь это могут быть районные/городские/учебные/рабочие паблики.
Напоминаю, что во всем анализе мы субъективно судим о группе в целом по некоторым участникам.

5) Мега аналитика

которую еще не придумали, поэтому пиши свои идеи и любые вопросы сюда: @socialgraph_admin . Нам очень нужна обратная связь, чтобы ткнуть нас носиком, где криво отображаются графики и какой инфы еще не хватает

планируется добавить таблицу с общими учебными заведениями, местами работы итд, что указаны на странице. Да и много чего еще, но всё равно ждём ваших идей.

Бонус. Метрики групп

Самые увлеченные котята могут изучить метрики графа по группам. Краткое описание предоставлено, но может придется дополнительно погуглить и не быть гуманитарием (в будущем и для них распишу, какие циферки о чем могут говорить).




Report Page