Нужно сделать сервис по аналитике в Телеграм
Если вам лень читать весь проект, то перейдите на сайт https://telemetr.me/ и поймёте, что нам нужно от вас. Иными словами нужно клонировать этот сервис.
P.S. Уже готов личный кабинет, скрипт на Yii по поиску аналитики и готовый дизайн на фигме.
Проект придётся разбить по частям и если вы можете помочь в реализации пишите мне в скайп (предпочтительнее): mlctnik или телеграм: https://t.me/BablorubTelegram Если вы потяните в одиночку, то пишите.
Работать предпочтительнее через безопасную сделку любого фриланс сервиса (можно по постоплате)
Бюджет: 4 тысячи долларов ( больше реально нет)
Введение:
Сразу оговорюсь, я начинал проект 4 месяца назад, поэтому заказал дизайн, небольшую админку и тестировку методов по сбору почасовой аналитики. Программист разработал скрипт на Yii в котором нужно немного доработать логику.
Проект был заморожен из-за отсутствия финансов. Поэтому, ищу нового программиста, тк старый уже надолго занят. Как он говорил, что логику доработать делов на несколько дней. Заинтересованным в работе скину файлы.
А теперь постараюсь расписать подробнее
Вот так выглядит админка (когда была залита на сервер, сейчас просто в папке)
Сюда добавили в ручную 6 каналов
Статистика отображается))
P.S. сразу оговорюсь, что я не программист и возможно объясню простыми словами, если не понятно, то всегда отвечу на вопросы. Мне на самом деле важна конечная цель, поэтому этапы работы можно менять и я всегда выслушаю вашу консультацию, как сделать лучше.
Задание 1 (если будем разбивать на части работу)
- Доделать скрипт так, чтобы он различал простые посты от рекламных.
Мы легко можем отслеживать простые посты у канала через скрипт. А у рекламных всегда есть ссылка на другой источник. Нужно чтобы скрипт различал рекламные посты. Как например у Телеметра они сохранены в отдельную рубрику (телеграм их не сохраняет): https://telemetr.me/posts/
- Должны отображаться аватарки каналов
- допилить логику так, чтобы через рекламные посты эти каналы добавлялись на сервер и показывали почасовую статистику
Мы выяснили, что Телеметр не добавляет каналы в ручную, а находит тогда, когда новый канал отрекламируется каналом, который уже есть в базе.
Весь принцип нашего скрипта (как я это понял со слов предыдущего программиста), что создаются юзерботы, которые без добавления на любой канал открытый или закрытый берут все данные о любой статистике (отписки, подписки, посты, аватарка и тд) И именно таким же макаром можно автоматически перейти по рекламному посту и отслеживать уже новый канал.
Ваша задача доделать логику так, чтобы он сам попёр искать каналы и потихоньку собирать базу. Думаю, что всё должно идти быстро, так как все друг у друга заказывают посты. Для теста собрать хотя бы 1 тысячу каналов.
P.S. У телеметра около 70 000 тысяч каналов у которых он постоянно отслеживает стату. Нужно также расчитать сколько нужно юзерботов, чтобы всё работало корректно и нормально загружалось. Я думаю, что после собранных 1000 каналов уже можно легко всё прикинуть.
*** промежуточное задание
Нам нужно учесть, что скрипт то должен работать на сервере. И так как данных будет много ( точно не знаю, но речь о сотнях гигабайт) нужно это всё дело куда разместить и настроить, чтобы потом туда парсить базу данных. Если у вас есть идеи на каком сервере можно всё разместить недорого, то пишите. И есть ли смысл вообще оплачивать хороший сервак, если им толком пользоваться не будут как минимум месяц ? Жду ваших советов.
Задание 2
Для любителей парсить базы данных
Нужно разработать парсер и спарсить данные с Телеметра за предыдущее время развития каналов и рекламных постов. Импортировать базу данных к нам на сервер, сделать так, чтобы всё отображалось корректно. По итогу, должно получиться так, что старые данные мы спарсили и вставили, а новые уже сохраняем сами.
Сразу оговорюсь, что парсить много. Посчитать сколько в точности сложно, но если верить словам создателя, то около 700 гигов информации.
Данные для парсинга:
Зходим сюда https://telemetr.me/channels/
Отсюда берём
1) аватарку
2) название канала
3) ссылку на канал
4) рубрику для каждого канала (GIF и video ; Блоггеры и тд)
Затем жмём кнопку анализ и видим почасовую статистику каждого канала. К примеру перейдем на канал Edward Bil
Собираем всю рекламную статистику за всё время.
То есть также:
1 ) колонка час (со временем и датой)
2) Колонка количество подписчиков
3) Колонка прирост
4) упоминание в других каналах с ссылкой на канал
Собрать рекламные посты
Заходим сюда https://telemetr.me/posts/
— Собираем аватарку
— название канала с его ссылкой
— сам пост ( все ссылки которые на нем и под ним)
— количество просмотров на пост и репостов
— картинки
Итого: спарсить почти 73 тысячи каналов с почасовой и обновляемой статистикой. И 30 млн постов.
P.S. надо учитывать, что пока мы это всё собирем их станет ещё больше, поэтому до момента запуска нужно сделать так, чтобы всё это дело сохранялось.
Продолжение тут https://telegra.ph/PRODOLZHENIE-TZ-12-08