Menu

Acelerando los descubrimientos de la investigación genómica para alimentar al mundo y combatir enfermedades

La investigación genómica está convirtiéndose rápidamente en uno de los principales generadores de datos masivos para la ciencia, con el potencial de igualar o aún sobrepasar la enorme salida de datos de la comunidad de físicos. Al igual que los físicos, los investigadores de ciencias de la vida en el ámbito universitario deben trabajar en conjunto con colegas de distintos lugares y acceder a registros de datos de todo el mundo.

La capacidad de crear y utilizar conexiones especializadas de alta velocidad como las que se necesitan entre las fuentes de datos y la capacidad de cálculo analítico es una herramienta muy poderosa.

Por ejemplo, en los Estados Unidos, el Centro Nacional para para la Información Biotecnológica (NCBI, por sus siglas en inglés) en Maryland en la Biblioteca Nacional de Medicina, es el mayor registro, el cual brinda acceso a conjuntos de datos genómicos masivos. El NCBI cuenta con casi 25 petabytes de datos de investigación que están disponibles para la comunidad global de científicos, incluyendo a investigadores que colaboran para encontrar mejores formas de realizar diagnósticos, tratamientos y prevenir el cáncer, como también para aquellos que trabajan en el desarrollo de nuevas variedades de plantas que resistan a las pestes, inundaciones y sequías.

El NCBI ofrece datos de secuencia genómica a biólogos como los investigadores del ámbito de la genómica de la Universidad Clemson (CU) en Carolina del Sur. El NCBI y la Universidad Clemson trabajaron en conjunto para transformar el flujo de investigación en la transferencia de grandes archivos de datos genómicos utilizando las conexiones de red avanzadas Internet2 y los servicios especializados Internet2. Este trabajo fue financiado en parte por una subvención de la National Science Foundation Campus Cyberinfrastructure—Network Infrastructure and Engineering Program a la Universidad Clemson.

El proyecto: optimizar la transferencia de datos para la investigación genómica

La posibilidad de acceder y analizar cantidades masivas de datos disponibles de manera más rápida es fundamental para acelerar el transcurso del tiempo entre el proceso de experimentación y el de descubrimientos. Los investigadores involucrados en este proyecto estaban ansiosos por extender los límites. La transferencia de datos a flujos de trabajo de análisis de ADN a la mayor velocidad posible, a través de instalaciones de red optimizadas y mecanismos de transferencia paralela, va a permitir a los investigadores recopilar datos y realizar experimentos a una escala sin precedentes. La capacidad de crear y utilizar conexiones especializadas de alta velocidad como las que se necesitan entre las fuentes de datos y la capacidad de cálculo analítico es una herramienta muy poderosa para optimizar el rendimiento del análisis genómico.

Mediante el uso de un circuito especializado de Internet2 Advanced Layer 2 Service (AL2S) de 10 Gigabits por segundo (Gbps) entre la CU y el NCBI, y modificando los protocolos de transferencia de archivos, las características del sistema de almacenamiento y la puesta a punto del software de red, los experimentos pudieron alcanzar una velocidad de transferencia de red de 7.5 Gbps utilizando el cliente de transferencia Aspera. Esto se compara a una velocidad de 0.5 Gbps que se alcanzaba antes de aplicar las optimizaciones. Después de la optimización, el equipo pudo pudo transferir los conjuntos de datos de un total de 12 terabytes entre el circuito Internet2 AL2S en 11,6 horas en lugar de ocho días.

Los resultados: científicos especializados en genómica acceden y analizan datos con mayor rapidez

Los científicos especializados en genómica no solo pudieron obtener datos con mayor rapidez, sino que esta transferencia de alta velocidad también les permite ahora descargar conjuntos de datos, procesarlos, rediseñar el experimento y repetirlo.

Este trabajo en conjunto entre investigadores y tecnólogos de Clemson y el NCBI ilustra cómo los servicios de red pueden integrarse en flujos de trabajo existentes para mejorar la productividad de la investigación y reducir el tiempo hacia el descubrimiento.

Si bien la tecnología avanzada tal como la computación de alto rendimiento y las redes de alta velocidad desempeñaron un rol fundamental en el éxito de este proyecto, el factor humano fue un componente clave ya que se convocó a las personas indicadas, tecnólogos y científicos, de ambas organizaciones.

Una de las enseñanzas más importantes fue el poder de la comunidad para eliminar obstáculos significativos a la investigación científica, lo que los colaboradores llaman “el nivel social”.

Alex Feltus, Profesor adjunto de Genética y Bioquímica de la Universidad Clemson dijo, “Este proyecto fue muy valioso para aprender a vincular dos organizaciones a través de AL2S de Internet2 y vamos a tomar muy en serio estas lecciones para optimizar las conexiones de informatización de la investigación con otras instituciones”.


Published: 10/2015

For more information please contact our contributor(s):