Мануал по social graph bot
Вы наткнулись на необычного бота - @friendly_graph_bot, который изучает дружеские коллективы/группы конкретного человека с помощью социального графа, а также бот готов построить полный анализ на нужную страницу ВК.
Зачем всё это? Изначально по приколу, но надеюсь, вы тут с благими намерениями
Оглавление
Как читать свой граф и как он строится
Как изучить свой граф:
Если вы построили граф на свою страницу, то достаточно посмотреть на имена в каждом кластере, тогда будет понятно, где друзья с вуза/школы/работы/секции/родной деревни. Вот пример "моего" графа.
Но если решили узнать другого человека поближе, то имена не помогут, а наш "ультра-мега полный анализ 3000" раскроет все карты. Подробнее в главе полный анализ, где анализируется информация со страниц и подписки всех друзей.
Немного теории, понятной всем (можно пропустить)
- Модулярность - это мера крутизны того, как мы разбиваем граф на группы. Чем сильнее кучкуются вершины внутри группы и меньше связок между группами, тем круче (ближе к 1) модулярность.
- Разбиваем на кластеры (группы друзей):
Чтобы найти группы друзей, используем алгоритм Лувена. Он оценивает разбиение по модулярности и старается сделать её максимальной. Короче говоря, ищет такое разделение, где связей внутри групп много, а между группами мало. - Размещаем точки:
Изначально граф - это каша точек в случайном месте. Тут работает алгоритм, который считает вершины графа как частицы, которые тянутся и отталкиваются друг от друга. Если вершины связаны, они тянутся друг к другу, а если нет - отталкиваются.
Алгоритм постоянно обновляет положение вершин, пока не найдет такое место, где все будут в равновесии.
Даже это пояснение написано с помощью ChatGPT, как и 80% кода бота. Добро пожаловать в новую эру.
Полный анализ
Если для графа достаточно выгрузить списки друзей каждого вашего друга, то в полном анализе выгружаются целиком страницы ваших друзей, вместе с их подписками, это занимает в 6 раз больше времени, поэтому такое удовольствие капельку платное, ведь двум студентам нужно оплачивать сервер и поддерживать 3к строчек говнокода.
Так вот, помимо графа, в полном анализе мы изучаем:
1) География
На страницах люди обычно указывают в разделе "город" свое нынешнее место жительства, "родной город" и так понятно. Учитывайте, что далеко не все указывают эту информацию на странице, поэтому можно судить по группе в целом по нескольким ее участникам.
Пример: Волгоград в "родном городе" указали 2 человека из зеленой группы, а на графике "город" эта зеленая группа разбрелась еще на Москву и Питер. Это одноклассники - кто-то поступил в столицы, многие остались. К аналогичному выводу можно прийти, анализируя "не себя".
2) Лидеры групп
Здесь всё просто, ищем людей с наибольшим количеством связей внутри своей группы.
3) Возраст
Возраст разбит на группы и пол. На этом шаге можно идентифицировать группу, которую я описал как "родственники", ведь они попали в 40+
4) Анализ сообществ
На первом графике рассмотрены общие паблики. Сразу видно какое отношение данная группа имеет к анализируемому человеку
На втором круговая диаграмма типов сообществ ("юмор", "новости" итд). Это общие интересы группы по всем их подпискам (к примеру, у 10 человек по 100 подписок, на диаграмме учтены типы всех 1000 сообществ)
На третьем графике "топ слов" из названий сообществ. По большей части смысловая нагрузка пересекается с первым графиком, но
Подписки информативнее всего описывают коллектив. Особое внимание на всякие "подслушано", ведь это могут быть районные/городские/учебные/рабочие паблики.
Напоминаю, что во всем анализе мы субъективно судим о группе в целом по некоторым участникам.
5) Мега аналитика
которую еще не придумали, поэтому пиши свои идеи и любые вопросы сюда: @socialgraph_admin . Нам очень нужна обратная связь, чтобы ткнуть нас носиком, где криво отображаются графики и какой инфы еще не хватает
планируется добавить таблицу с общими учебными заведениями, местами работы итд, что указаны на странице. Да и много чего еще, но всё равно ждём ваших идей.
Бонус. Метрики групп
Самые увлеченные котята могут изучить метрики графа по группам. Краткое описание предоставлено, но может придется дополнительно погуглить и не быть гуманитарием (в будущем и для них распишу, какие циферки о чем могут говорить).