Этап 3

Этап 3


Рассказать свою историю

Я люблю кинематограф. Люблю красивое кино которое цепляет, которое пробирает до мурашек. Стараюсь находить такие фильмы, смотреть и наслаждаться ими.

Но что-бы фильм вышел именно таким, каких хочется зрителю, должны сложиться несколько факторов. Но рассмотреть какие всё же факторы важны, часто мешают эмоции которые даёт кинолента.

Поэтому увидев в списке предложенных тем датасет c IMDB, я сразу же решил попробовать понять почему же одни фильмы хорошие, а другие не очень. Какие фильмы нравятся аудитории в массовом порядке.

Для того, чтоб как-то описать хорош ли фильм, будем использовать рейтинг с сайта IMDB. IMDB это сайт где люди выставляют оценки от 1 до 10 фильмам. Итак поехали.

На вход я получил датасет из 5043 фильмов о которых было известно все; ну или практически всё. У меня были как и основные данные, так и небольшие типа количества лайков у третьего актера в фильме.

Сначала я отсортировал фильмы по сборам, ведь самый честный голос тот, за который ты заплатил деньгой подумал. Но нет. Вы видите результаты сортировки. Ожидаемо тут одни блокбасетры, с хорошими спецэффектами которые и дают кассу. Поняв что это не та метрика что мне необходима я продолжил поиски, но уже в другую сторону.

Полностью изменив подход я решил начать с начала и для начала глянул сколько же фильмов выпускается. Увидев график я не мог не обрадоваться такому, почти экспоненциальному росту популярности фильмов за последние годы.

Но уже тут радость пришлось отложить до лучших времен, так как основная часть фильмов это середнячки, хотя и весьма сильные. Кстати, обратите внимание на распределение. Даже тут наш любимый гауссиан снова в деле.

Решив добавить ещё характеристики, я выбрал дату выпуска картины. Увидев это я подумал что ничего не менятеся. В голову сразу же пришло знаменитое порицание ханжей: "Раньше было лучше". Испугавшись за это я решил посмотреть, так ли это на самом деле. К моему глубокому сожалению оказалось что да, раньше среднее качество картин было выше; но вспомнив что в те седые времена достать кинокамеру и собрать людей для съемок было сложнее я понял что вряд ли стоить беспокоится за кино.

Продолжая свои поиски серебряной пули для идеально фильма я перешел на его продолжительность. Построив тепловую карту сразу же удивился её рахмаху. Фильмы играют не только в категории корометражек(10-30), но и в достаточно длинном(511 минут или 8.5 часов). Но на карте видно что, что такие ленты не пользуются популярностью у людей, им нравятся фильмы по 1.5 часа при есть небольшая корреляция между оценкой и увеличением длины картины, но при этом не больше двух часов.

Поняв что дальше я не могу расчитывать только на оценки пользователей я попробовал вернутся к тому, с чего начинал, а именно с бюджета. Тут мы видим что получить оценку не обязательно иметь гигантские сборы, однако если фильм собрал хорошую кассу, то мы можем с большей вероятностью можем получить сносные оценки. (это видно в нижней части тепловой карты).


Понимая что в таком массиве данных я могу загрузнуть надолго, я решил сосредоточить свое внимание на более успешных фильмах у пользователей нижней границей оценок которых яаляется 8. Таких лент оказалось всего 200

Вернувшись к приметам и попытавшись понять когда же были лучшие картины я понял одну вещь. Сейчас. Да, именно так. Живем мы сейчас и стоим на плечах тех, кто создавал шедевры; тех, кто понимал как достигать катарсиса, но при этом всем зритель стал более искушенным и чтоб его удовлетворить нужно не просто повторять, но постоянно улучшать произведения, что и делают режиссеры.


Любите кино. Смотрите кино.

Report Page