Наши выпускники - самые лучшие!

Михаил Перышкин и Дмитрий Кабанов рассказали об участии в школе:
— Руководство нашего университета предложило нам поучаствовать в летней Школе прикладного анализа данных. Мы решили, что это неплохой шанс получить новые компетенции и обзавестись полезными знакомствами. Мы ехали с уже примерным пониманием направления нашего исследования, но знаний в области больших данных у нас не было, поэтому во время очного этапа мы искали консенсус между собственным видением проекта и техническими возможностями современных компьютеров. C этим нам очень помогли наставники Data-Diving. На протяжении 4 дней мы обсуждали свои гипотезы и подготавливали драфты экспертов.
Изначально мы предполагали использовать только Gephi в качестве основного инструмента, но в ходе работы стало понятно, что данных слишком много, поэтому большую часть работы над проектом мы провели в PolyAnalyst. До этого у нас не было опыта работы с no-code и low-code инструментами, и мы относились к ним довольно скептично, так как казалось, что они могут решить только простые задачи. Жаль, что не освоили этот инструмент раньше!
Проект «Сетевая модель публикаций Российской Федерации и Республики Беларусь по ключевым научным направлениям Программы развития ПсковГУ»
Цель проекта – проанализировать место ПсковГУ на научном ландшафте Союзного государства по ключевым научным направлениям Программы развития ПсковГУ.
В ходе очного этапа обучения было сформировано техническое задание на выгрузку выходных данных публикаций исследователей из России и Беларуси за период с 2019 по 2022 год из библиографической базы данных OpenAlex (преобладают публикации из Scopus и WOS) по следующим тематикам: Математика и информационные технологии, Фундаментальная и прикладная медицина, Образование и педагогика, Аддитивные технологии, Электротехника, Экология.
Полученный датасет был обработан в PolyAnalyst с помощью инструментов анализа больших данных для очистки от лишней информации. После обработки данных был получен документ, содержащий 10 тысяч уникальных записей о публикациях исследователей из России и Беларуси, где каждому автору была присвоена его аффилиация с университетом, страной, перечень его научных интересов (концептов OpenAlex) и индекс Хирша. Полученные данные были добавлены к сетевой модели соавторства, что позволило добавить дополнительные характеристики («Университет», «Страна», «Индекс Хирша») каждому автору.
В качестве тестового варианта реализации цели проекта была создана сетевая модель соавторства исследователей из России и Беларуси по концепту «Electric power transmission». Сетевой анализ показал, что на данный момент между исследователями из России и Беларуси нет сложившегося взаимодействия по данному концепту. Большинство исследовательских групп (77,3%) формируется для написания 1 статьи. Только 5,13% рассмотренных авторов формируют систематические исследовательские коллективы (пишут от 3 до 6 совместных статей).

За рассмотренный период было выявлено 4 исследовательские группы из ПсковГУ. Все работы написаны по тематике электроэнергетики. Отдельно стоит отметить, что за исключением одной группы, где был приглашен внешний автор, все работы писались коллективом работников ПсковГУ. Цвет узла отображает характеристику «Степень посредничества», чем он более насыщен, тем большую роль при коммуникации играет данный узел. Видно, что почти во всех группах нет дифференциации по коммуникации. В то же время, в одной из групп присутствует 1 автор, который является ключевым посредником для данной группы.
В дальнейшем мы планируем развивать наш проект до полноценной модели оценки публикационной активности на основе сетевого анализа и анализа больших данных.