Искусственный интеллект в помощь сельскому хозяйству: как машинное обучение поможет определению функций генов у сельскохозяйственных растений

Искусственный интеллект в помощь сельскому хозяйству: как машинное обучение поможет определению функций генов у сельскохозяйственных растений

ИППИ РАН

Сотрудники Института проблем передачи информации им. А.А. Харкевича РАН, совместно с коллегами из Сколтеха и МФТИ, разработали алгоритм, который позволит упростить предсказание функций генов у сельскохозяйственных растений. Это, в свою очередь, поможет ускорить селекцию сортов с необходимыми характеристиками. Алгоритм базируется на межвидовом сравнении профилей экспрессии (мест активности) генов с использованием методов машинного обучения. Результаты работы были опубликованы в журнале PLOS Computational Biology.

Картинка сгенерирована нейросетью Kandinsky 2.1 по ключевым словам из текста

Растущая численность населения Земли и нарастание аномальных климатических явлений ставят новые вызовы перед сельским хозяйством по выведению новых сортов, как более урожайных, так и более устойчивых к неблагоприятным условиям среды. В последние годы активно развиваются новые методы получения сортов, значительно ускоряющие и расширяющие возможности проведения селекционных работ, такие как геномная селекция и направленное редактирование. Одно из основных препятствий для их широкого применения — недостаток информации о функциях генов, контролирующих те или иные хозяйственно значимые признаки. 

Определение последовательности генома с развитием новых технологий секвенирования сильно упростилось, но это только первый шаг на пути понимания механизмов регуляции развития, которые нужно корректировать для придания растениям необходимых свойств. Такому пониманию сильно помогает сравнение сельскохозяйственных объектов с модельными видами. Это позволяет ограничить круг генов-кандидатов для дальнейшей работы. Среди растений модельный вид – резуховидка Таля, Arabidopsis thaliana, про функции его генов уже известно достаточно много. Однако такой подход предполагает, что гены, сходные по последовательности, и функции выполняют схожие. Это предположение не всегда верно, особенно у растений. Если на молекулярном уровне, как правило, это действительно так, то на уровне организма часто происходит модификация биологических функций генов за счет перенастройки их регуляции без значимого изменения их последовательностей (например, ген начинает работать в других органах или при других условиях). Задача усложняется особенностями эволюции генома растений: для них характерны многократные удвоения (полиплоидизация) с последующим изменением функции появившихся дополнительных генов. 

Участники научной коллаборации между ИППИ, Сколтехом и МФТИ разработали метод, позволяющий существенно улучшить процедуру сравнения функций генов у разных видов. Метод основан на привлечении дополнительных данных о гене помимо его последовательности: информации о том, в каких органах и тканях или при каких условиях он экспрессируется (активен). Метод опирается на то, что в большинстве случаев сохранение профиля экспрессии свидетельствует о сохранении биологической функции. Поскольку прямое сравнение уровней экспрессии между видами затруднено (из-за разной структуры и темпов развития), авторы использовали подходы, основанные на машинном обучении, для которых учет структуры растения не требуется. Предложенный метод при сравнении модельного объекта Arabidopsis thaliana с гречихой и кукурузой позволил успешно разделить близкие по последовательностям гены сельскохозяйственных объектов на те, которые имеют ту же функцию, как у модельного объекта, и те, функция которых претерпела изменения. «В настоящее время мы развиваем этот подход, в том числе, вовлекая в анализ данные о таких важных сельскохозяйственных культурах как огурец, виноград, подсолнечник и других. В результате мы надеемся сделать инструмент, облегчающий планирование экспериментов по созданию новых сортов. Исследователи, создающие новые линии, смогут понять, соответствует ли функция интересующего их гена модельному объекту. В случае соответствия можно будет переходить к экспериментам по редактированию. В случае же, когда функция претерпела изменения, будет возможно избежать ошибок, связанных с неверными ожиданиями от изменения в таких генах», — говорит ведущий автор исследования, заведующий лабораторией геномики растений ИППИ РАН Алексей Пенин

Работа была поддержана Российским научным фондом и Министерством науки и высшего образования Российской Федерации. 



Report Page