GridFTP es una extensión del Protocolo de transferencia de archivos (FTP) para la computación en cuadrícula . [1] El protocolo se definió en el grupo de trabajo GridFTP del Open Grid Forum . [2] [3] [4] Hay múltiples implementaciones del protocolo; el más utilizado es el proporcionado por Globus Toolkit . [ cita requerida ]
El objetivo de GridFTP es proporcionar una transferencia de archivos más confiable y de alto rendimiento, por ejemplo, para permitir la transmisión de archivos muy grandes. GridFTP se utiliza ampliamente en grandes proyectos científicos como el Gran Colisionador de Hadrones y en muchos centros de supercomputación y otras instalaciones científicas.
GridFTP también aborda el problema de la incompatibilidad entre los sistemas de almacenamiento y acceso. Anteriormente, cada proveedor de datos pondría sus datos a disposición de su propia manera específica, proporcionando una biblioteca de funciones de acceso. Esto dificultó la obtención de datos de múltiples fuentes, requiriendo un método de acceso diferente para cada uno y dividiendo así el total de datos disponibles en particiones. GridFTP proporciona una forma uniforme de acceder a los datos, que abarca funciones de todos los diferentes modos de acceso, construyendo y ampliando el estándar FTP universalmente aceptado. Se eligió FTP como base debido a su uso generalizado y porque tiene una arquitectura bien definida para las extensiones del protocolo (que pueden descubrirse dinámicamente).
Se han desarrollado numerosos clientes GridFTP. El sistema de software como servicio de Globus Online es particularmente popular. [ cita requerida ]
Características de GridFTP
GridFTP se integra con Grid Security Infrastructure , que proporciona autenticación y cifrado para transferencias de archivos, con niveles de confidencialidad e integridad de datos especificados por el usuario, también para transferencias entre servidores (lo que FTP llama File eXchange Protocol , FXP).
GridFTP logra un uso mucho mayor del ancho de banda que la tecnología de flujo de datos convencional mediante el uso de múltiples flujos TCP simultáneos. [5] Los archivos se pueden descargar en pedazos simultáneamente desde múltiples fuentes; o incluso en flujos paralelos separados de la misma fuente, que aún puede hacer un mejor uso del ancho de banda. Las transferencias rayadas e intercaladas, nuevamente de fuentes múltiples o únicas, permiten mayores aumentos de velocidad.
Aunque FTP tiene la capacidad de reanudar una transferencia de archivo interrumpida desde un punto específico en un archivo, no admite la transmisión de solo una determinada parte de un archivo. GridFTP permite enviar un subconjunto de un archivo. Esta característica es útil en aplicaciones donde solo se requieren pequeñas secciones de un archivo de datos muy grande para el procesamiento (un ejemplo motivador es el procesamiento de datos de un experimento de física de alta energía, un uso tradicional de la tecnología Grid).
GridFTP proporciona una implementación de FTP tolerante a fallas, para manejar la indisponibilidad de la red y los problemas del servidor. Las transferencias también se pueden reiniciar automáticamente si ocurre un problema.
La conexión TCP subyacente en FTP tiene numerosas configuraciones, como el tamaño de la ventana y el tamaño del búfer. GridFTP permite la negociación automática (o manual) de estas configuraciones para proporcionar velocidades de transferencia óptimas y confiabilidad (es probable que las configuraciones óptimas sean diferentes con archivos grandes y para grupos grandes de archivos).
Referencias
- ^ Allcock, W .; Bresnahan, J .; Kettimuthu, R .; Enlace, M. (2005). "El servidor y el marco GridFTP rayado de Globus". Conferencia ACM / IEEE SC 2005 (SC'05) . pag. 54. doi : 10.1109 / SC.2005.72 . ISBN 1-59593-061-2.
- ^ "Gestión de datos de investigación simplificada. | Globus" . www.globus.org . Consultado el 9 de junio de 2020 .
- ^ Allcock, W. (abril de 2003). "GridFTP: Extensiones de protocolo a FTP para Grid" (PDF) .
- ^ Mandrichenko, Igor (11 de julio de 2003). "Mejoras en el protocolo GridFTP" (PDF) .
- ^ Sarro, Luis Manuel. (2012). Astrostatística y minería de datos . Eyer, Laurent., O'Mullane, William. Dordrecht: Springer. ISBN 978-1-4614-3323-1. OCLC 809767631 .