V Удай Кумар Редди, Раджашри Шеттар и Видья Ниранджан
Изобретение новых вычислительных технологий, таких как облачные и сеточные вычисления, снизило стоимость вычислений за счет оптимального распределения ресурсов. Тем не менее, многие приложения не полностью перешли на эти новые технологии, в основном из-за нежелания ученых делиться данными через Интернет по соображениям безопасности. Несмотря на то, что стоимость оборудования была радикально снижена, немногим приложениям требуется высокая вычислительная мощность для обработки или анализа огромных научных данных. Также из-за высокой стоимости, необходимой для приобретения вычислительных ресурсов, многие научные приложения еще не полностью материализовались. Одним из таких приложений является секвенирование следующего поколения (NGS), которому придется иметь дело с терабайтами геномных данных, что потребует высокой вычислительной мощности. Следовательно, для эффективной обработки данных требуется суперкомпьютер.
В этой статье предлагается использовать промежуточное программное обеспечение с открытым исходным кодом Berkeley Open Infrastructure for Network Computing (BOINC) для обеспечения сборки de novo с использованием кластера настольных машин в парадигме мастера и добровольца. Парадигма может быть установлена в обычных компьютерных лабораториях, что устраняет как проблемы с пропускной способностью, так и проблемы безопасности при использовании методов облачных и сетевых вычислений через Интернет. Эта парадигма создает виртуальный суперкомпьютер в лабораториях для обработки данных.