Нужно сделать сервис по аналитике в Телеграм

Нужно сделать сервис по аналитике в Телеграм


Если вам лень читать весь проект, то перейдите на сайт https://telemetr.me/ и поймёте, что нам нужно от вас. Иными словами нужно клонировать этот сервис.


P.S. Уже готов личный кабинет, скрипт на Yii по поиску аналитики и готовый дизайн на фигме.

Проект придётся разбить по частям и если вы можете помочь в реализации пишите мне в скайп (предпочтительнее): mlctnik или телеграм: https://t.me/BablorubTelegram Если вы потяните в одиночку, то пишите.


Работать предпочтительнее через безопасную сделку любого фриланс сервиса (можно по постоплате)


Бюджет: 4 тысячи долларов ( больше реально нет)



Введение:

Сразу оговорюсь, я начинал проект 4 месяца назад, поэтому заказал дизайн, небольшую админку и тестировку методов по сбору почасовой аналитики. Программист разработал скрипт на Yii в котором нужно немного доработать логику.


Проект был заморожен из-за отсутствия финансов. Поэтому, ищу нового программиста, тк старый уже надолго занят. Как он говорил, что логику доработать делов на несколько дней. Заинтересованным в работе скину файлы.


А теперь постараюсь расписать подробнее


Вот так выглядит админка (когда была залита на сервер, сейчас просто в папке)

Сюда добавили в ручную 6 каналов

Статистика отображается))



P.S. сразу оговорюсь, что я не программист и возможно объясню простыми словами, если не понятно, то всегда отвечу на вопросы. Мне на самом деле важна конечная цель, поэтому этапы работы можно менять и я всегда выслушаю вашу консультацию, как сделать лучше.


Задание 1 (если будем разбивать на части работу)


- Доделать скрипт так, чтобы он различал простые посты от рекламных.

Мы легко можем отслеживать простые посты у канала через скрипт. А у рекламных всегда есть ссылка на другой источник. Нужно чтобы скрипт различал рекламные посты. Как например у Телеметра они сохранены в отдельную рубрику (телеграм их не сохраняет): https://telemetr.me/posts/


  • Должны отображаться аватарки каналов


- допилить логику так, чтобы через рекламные посты эти каналы добавлялись на сервер и показывали почасовую статистику

Мы выяснили, что Телеметр не добавляет каналы в ручную, а находит тогда, когда новый канал отрекламируется каналом, который уже есть в базе.

Весь принцип нашего скрипта (как я это понял со слов предыдущего программиста), что создаются юзерботы, которые без добавления на любой канал открытый или закрытый берут все данные о любой статистике (отписки, подписки, посты, аватарка и тд) И именно таким же макаром можно автоматически перейти по рекламному посту и отслеживать уже новый канал.

Ваша задача доделать логику так, чтобы он сам попёр искать каналы и потихоньку собирать базу. Думаю, что всё должно идти быстро, так как все друг у друга заказывают посты. Для теста собрать хотя бы 1 тысячу каналов.


P.S. У телеметра около 70 000 тысяч каналов у которых он постоянно отслеживает стату. Нужно также расчитать сколько нужно юзерботов, чтобы всё работало корректно и нормально загружалось. Я думаю, что после собранных 1000 каналов уже можно легко всё прикинуть.



*** промежуточное задание

Нам нужно учесть, что скрипт то должен работать на сервере. И так как данных будет много ( точно не знаю, но речь о сотнях гигабайт) нужно это всё дело куда разместить и настроить, чтобы потом туда парсить базу данных. Если у вас есть идеи на каком сервере можно всё разместить недорого, то пишите. И есть ли смысл вообще оплачивать хороший сервак, если им толком пользоваться не будут как минимум месяц ? Жду ваших советов.



Задание 2

Для любителей парсить базы данных


Нужно разработать парсер и спарсить данные с Телеметра за предыдущее время развития каналов и рекламных постов. Импортировать базу данных к нам на сервер, сделать так, чтобы всё отображалось корректно. По итогу, должно получиться так, что старые данные мы спарсили и вставили, а новые уже сохраняем сами.


Сразу оговорюсь, что парсить много. Посчитать сколько в точности сложно, но если верить словам создателя, то около 700 гигов информации.


Данные для парсинга:

Зходим сюда https://telemetr.me/channels/

Отсюда берём

1) аватарку

2) название канала

3) ссылку на канал

4) рубрику для каждого канала (GIF и video ; Блоггеры и тд)

Затем жмём кнопку анализ и видим почасовую статистику каждого канала. К примеру перейдем на канал Edward Bil

Собираем всю рекламную статистику за всё время.

То есть также:

1 ) колонка час (со временем и датой)

2) Колонка количество подписчиков

3) Колонка прирост

4) упоминание в других каналах с ссылкой на канал

Собрать рекламные посты

Заходим сюда https://telemetr.me/posts/

— Собираем аватарку

— название канала с его ссылкой

— сам пост ( все ссылки которые на нем и под ним)

— количество просмотров на пост и репостов

— картинки

Итого: спарсить почти 73 тысячи каналов с почасовой и обновляемой статистикой. И 30 млн постов.


P.S. надо учитывать, что пока мы это всё собирем их станет ещё больше, поэтому до момента запуска нужно сделать так, чтобы всё это дело сохранялось.




Продолжение тут https://telegra.ph/PRODOLZHENIE-TZ-12-08



Report Page