Анета Савиковска
Представлены комплексные анализы данных для высокопроизводительных данных ЖХ-МС. Показаны методы статистического анализа и интеграции для многофакторных экспериментов. Примеры наборов данных взяты из исследований реакции злаков на патогенную инфекцию и ячменя (Hordeum vulgare) в условиях засухи. Были проанализированы первичные метаболиты, вторичные метаболиты и белки.
Предварительная обработка, анализ и визуализация данных были выполнены в системе R. Статистический анализ был выполнен с использованием процедур в пакете Genstat. Представлены методы интеграции и визуализации омических данных с помощью сетей.
Корреляционные сети и дифференциальные корреляционные сети были построены для сравнения связей между метаболитами и белками в различных условиях. Признаки представлены узлами, линии (ребра) соответствуют корреляциям между парами признаков. Выявлены модули - кластеры с высококоррелированными признаками. Указаны хабы, которые являются признаками с большим количеством связей (корреляций с другими признаками).
Анализ корреляционной сети был выполнен с использованием пакета WGCNA в R, корреляционная матрица Пирсона была преобразована в матрицу смежности с использованием степенной функции. Модули были обнаружены с помощью кластеризации. Дифференциальные корреляционные сети были созданы с использованием теста на основе Z-преобразования Фишера с поправкой Бонферрони. Визуализация сетей была выполнена в Cytoscape.
Алгоритмы могут быть адаптированы к любым данным жидкостной хроматографии-масс-спектрометрии с высокой пропускной способностью.