Использование машинного обучения для прогнозирования доходности ICO

Использование машинного обучения для прогнозирования доходности ICO

@ICOшечная

Вы слышали о биткоин? Это криптовалюта, а согласно Wikipedia:

Криптовалюта - это цифровой актив, созданный для работы в качестве среды обмена, использующей криптографию для обеспечения безопасности транзакций, для управления созданием дополнительных единиц, и для проверки передачи активов


Знаете, что существует множество криптовалют? Фактически, ежедневно создаются новые монеты (токены). Процесс создания новой криптовалюты называется ICO (Initial Coin Offering - начальное предложение монет). Участвуя в этом процессе, можно приобрести вновь созданные монеты. Это форма финансирования новых компаний/организаций.

Обычно, стоимость новых токенов в процессе ICO невелика, поскольку сами токены основаны исключительно на идее, или на существующем прототипе, и о новом проекте знает не очень много людей. Однако когда новыми токенами начинают обмениваться, или компания поставляет за них продукты, то цена токенов может увеличиться в несколько раз. Например, если вы были в числе первых инвесторов в Ethereum (ETH), вы могли приобрести 1 ETH примерно за 30 центов США. Но на момент написания настоящей статьи, эта криптовалюта стоит уже 936 $. Это доход почти в 300 000 %. И если бы вы инвестировали 100 $ в ICO для Ethereum, то вы могли бы заработать около 300 000 $ :-)


Цена Ethereum по данным (оценка на 16 февраля 2018)


Глядя на эти совершенно ненормальные заработки, можно понять, почему так много людей стремится инвестировать в проекты такого рода. Но сделать это не просто. В настоящее время проводится настолько много ICO, что выбор обещающего проекта для инвестирования очень сложен. Очень часто ICO может оказаться аферой, и инвесторы потеряют все свои деньги.


Наивысшие доходы от ICO, источник: (оценка на 16 февраля 2018)


Существует много сайтов, накапливающих информацию о готовящихся ICO, например, icodrops. Кроме того, в сообществе криптовалют существуют люди, занимающиеся отслеживанием и оценкой готовящихся ICO. Один из таких экспертов ICO, который нравится лично мне, это Ян Балина (Ian Balina). Для выбора инвестиций в ICO он использует подход, основанный на данных. Он предлагает таблицу, в которой описывается каждое ICO, с числами, очками и оценками. И он выбирает ICO для инвестиций на основании вычисленной оценки. Прекрасно!



Таблица, предлагаемая Яном


Но давайте сделаем больше, чем просто анализ таблицы! Я предлагаю модель машинного обучения, которая на основании данных Яна предсказывает доход от инвестиций.


Вначале я возьму данные из таблицы Яна я создам свой набор данных. Для каждой ICO я добавляю минимальную, максимальную и начальную цену, взятые из coinmarketcap.com (CMC) (начальная цена - это первая цена из диаграммы CMC). Я также исправил некоторые цены ICO, используя данные из icodrops.com и tokendata.io.

Как можно заметить, для некоторых строк цены из coinmarketcap.com отсутствуют. Это связано с тем, что эти проекты новые, и еще не достигли стадии обмена криптовалюты. Теперь давайте спрогнозируем максимальный возможный доход для них! 


В качестве данных для обучения модели будут использоваться строки с полной информаций о ценах на CMC. Входными колонками для модели будут:

Ian_ICO_Grade - оценка, созданная Яном Балина

Largest_Bonus - информация о размере бонуса

ICO Price - цена ICO

Количество токенов ICO (число токенов, доступных для продажи во время ICO)

Доля предложения (количества токенов, доступных в ICO, деленное на общее количество токенов)

ICO Market Cap - рыночная капитализация ICO

Информация о наличии прототипа

Очки группы, вычисленные Яном

Очки советников, вычисленные Яном

Очки за идею ICO

Размер сообщества

Информации о защите токенов

Тип продукта

Пользователи продукта

На выходе модели будет получена величина Max_CMC_x, определяемая по формуле 


Max_CMC_x = Max_CMC / ICO_Price 


(замечание: при обучении я использую логарифм от Max_CMC_x, так как его распределение лучше подходит для модели машинного обучения).

Для моделей машинного обучения я применил сервис mljar.com, с 5-кратной взаимной проверкой, метрикой оценки MSE, и алгоритмами xgboost, lightGBM, и случайной выборки.

Установки модели машинного обучения в mljar.com


Сервис MLJAR выполняет поиск среди различных алгоритмов машинного обучения и выбирает тот, который лучше подходит для представленных данных. Это дает нам несколько моделей!

Модели из MLJAR


Какие характеристики важны для прогнозирования дохода от инвестиции в ICO?


Давайте оценим важность характеристики для наилучшей модели.


Важность факторов для оценки


Чем длиннее полоса, тем более важна характеристика.

Наиболее важной характеристикой для прогнозирования доходов от ICO является цена ICO! Вы можете попытаться объяснить это: чем ниже цена, тем больше места для ее роста. Все просто.

Следующей по важности характеристикой является оценка Яна. Чем выше оценка, тем лучше проект, и тем выше шансы роста цены токенов.

К наиболее важным шести характеристикам также относятся: количество токенов, проданных во время ICO, рыночная капитализация ICO, и доля предложения - я считаю, что тут, как и в случае цены ICO, инвесторы пытаются оценить возможности будущего роста.

Также важно и количество членов сообщества - чем больше людей заинтересованы в проекте, тем лучше :-)


Какую доходность проведенных ICO прогнозирует модель?

Давайте посмотрим, каковы итоговые (OOF) прогнозы модели машинного обучения, и сравним их с теми доходами, которые она дает для реально проведенных ICO. Будет интересно сравнить эти результаты с реальной доходностью. Ниже приводится 20 ведущих токенов, имеющих наивысшую доходность согласно модели:

Колонка OOF_Prediction (итоговый прогноз) содержит прогноз модели машинного обучения для проведенных ICO

Согласно модели, наивысшую доходность должны иметь ICO для криптовалют District0x, 0x и Red Pulse. Интересные результаты получены для токенов, у которых OOF_Prediction намного превышает Max_CMC_x (Max_CMC_x = Max_CMC/ICO_Price). Например, у Icon, которая показывает 115-кратную доходность на инвестиции, модель прогнозирует только 16-кратную доходность. 

Я трактую это следующим образом: Токены, у которых значение OOF_Prediction намного выше, чем значение Max_CMC_x, все еще предоставляют пространство для роста - например, AirToken может вырасти еще в 5 раз. С другой стороны, токены, у которых OOF_Prediction намного ниже, чем Max_CMC_x, возможно, переоценены - либо модель машинного обучения дала здесь ошибку.

Все прогнозы моделирования посредством машинного обучения для уже проведенных ICO приведены здесь. 


Какую доходность для новых ICO прогнозирует модель?

Теперь сравним прогнозы для токенов, доходность которых еще не известна! Ниже приводится 20 наивысших прогнозов доходности при использовании модели машинного обучения:



Прогнозы доходности модели машинного обучения


Как можно видеть, согласно этой модели, наибольшую доходность будет иметь токен с кодовым наименованием Zombie в таблице Яна.

С другой стороны, доходность для токена Telegram не слишком велика, поскольку модель предсказывает лишь 6.8-кратную доходность. По-моему, это вызвано значительной капитализацией ICO, и именно поэтому модель оказалась такой консервативной в смысле прогноза доходности.


Выводы:

Инвестирование в ICO может оказаться весьма прибыльным. Но выбор правильного токена для инвестирования требует проведения тщательного исследования. Подход, основанный на анализе данных, по моему мнению, является наиболее уместным. А добавление к таблице прогноза на основе модели машинного обучения, может предоставить инвесторам больше понимания:

Знания возможной доходности

Оценки потенциальной выходной цены


Оценки, полученные методом машинного обучения, могут также быть использованы и теми, кто создает ICO, чтобы предложить более привлекательную для инвесторов цену токенов.

Машинное обучение является дополнительным фактором для оценки.

Не забывайте что входя в ICO на пресейле вместе с командой ICOшечная вы увеличиваете шансы на успех, поскольку мы всегда получаем более выгодные условия. По вопросам участия @remen4

Для создания модели машинного обучения был использован сервис MLJAR. 


Report Page