De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda
En este diagrama, el enrutador es un único punto de falla para la red de comunicación entre computadoras.

Un único punto de falla ( SPOF ) es una parte de un sistema que, si falla , detendrá el funcionamiento de todo el sistema . [1] Los SPOF son indeseables en cualquier sistema con un objetivo de alta disponibilidad o confiabilidad , ya sea una práctica comercial, una aplicación de software u otro sistema industrial.

Resumen [ editar ]

Los sistemas se pueden hacer robustos agregando redundancia en todos los SPOF potenciales. La redundancia se puede lograr en varios niveles.

La evaluación de un SPOF potencial implica identificar los componentes críticos de un sistema complejo que provocaría una falla total del sistema en caso de mal funcionamiento . Los sistemas altamente confiables no deben depender de ningún componente individual de este tipo.

Por ejemplo, el propietario de una pequeña empresa de cuidado de árboles solo puede tener una trituradora de madera . Si la astilladora se rompe, es posible que no pueda completar su trabajo actual y tenga que cancelar trabajos futuros hasta que pueda obtener un reemplazo. El propietario de la empresa de cuidado de árboles puede tener piezas de repuesto listas para la reparación de la trituradora de madera, en caso de que falle. En un nivel superior, es posible que tenga una segunda trituradora de madera que pueda llevar al lugar de trabajo. Finalmente, al más alto nivel, puede tener suficiente equipo disponible para reemplazar completamente todo en el sitio de trabajo en caso de múltiples fallas.

  • Posibles SPOF en una configuración simple.

  • Usar redundancia para evitar algunos SPOF.

  • Sistema completamente redundante sin SPOF. (Nota: se asume que las fuentes del generador y de la red tienen una clasificación de N cada una, que cada UPS tiene una clasificación de N y que "A / C" y "Eléctrico" son en sí mismos sistemas completamente tolerantes a fallas.

Computación [ editar ]

En informática, la redundancia se puede lograr a nivel de componentes internos, a nivel de sistema (múltiples máquinas) o a nivel de sitio (replicación).

Normalmente, se implementaría un equilibrador de carga para garantizar una alta disponibilidad para un clúster de servidores a nivel del sistema.

En un clúster de servidores de alta disponibilidad , cada servidor individual puede lograr redundancia de componentes internos al tener múltiples fuentes de alimentación, discos duros y otros componentes. La redundancia a nivel del sistema se puede obtener al tener servidores de repuesto esperando para asumir el trabajo de otro servidor si falla.

Dado que un centro de datos suele ser un centro de soporte para otras operaciones, como la lógica empresarial, representa un SPOF potencial en sí mismo. Por lo tanto, a nivel de sitio, todo el clúster se puede replicar en otra ubicación, donde se puede acceder a él en caso de que la ubicación principal no esté disponible. Por lo general, esto se aborda como parte de un programa de recuperación de desastres (resiliencia) de TI.

Paul Baran y Donald Davies desarrollaron la conmutación de paquetes , una parte clave de las "redes de comunicaciones de supervivencia". Estas redes, incluidas ARPANET e Internet  , están diseñadas para no tener un solo punto de falla. Múltiples rutas entre dos puntos cualesquiera de la red permiten que esos puntos continúen comunicándose entre sí, los paquetes "se enrutan" dañados , incluso después de una sola falla de cualquier ruta en particular o cualquier nodo intermedio.

Ingeniería de software [ editar ]

En la ingeniería de software , se produce un cuello de botella cuando la capacidad de una aplicación o un sistema informático está severamente limitada por un solo componente. El cuello de botella tiene el rendimiento más bajo de todas las partes de la ruta de la transacción.

Ingeniería de rendimiento [ editar ]

El seguimiento de los cuellos de botella (a veces conocidos como " puntos calientes ", secciones del código que se ejecutan con más frecuencia, es decir, que tienen el mayor número de ejecuciones) se denomina análisis de rendimiento . La reducción generalmente se logra con la ayuda de herramientas especializadas, conocidas como analizadores de rendimiento o perfiladores . El objetivo es hacer que esas secciones particulares de código funcionen lo más rápido posible para mejorar la eficiencia algorítmica general .

Seguridad informática [ editar ]

Un error en un solo componente puede comprometer todo el sistema.

Otros campos [ editar ]

El concepto de un único punto de fallo también se ha aplicado a los campos fuera de la ingeniería, computadoras y redes, tales como las empresas de suministro cadena de gestión [2] y la gestión del transporte. [3]

Las estructuras de diseño que crean puntos únicos de falla incluyen cuellos de botella y circuitos en serie (a diferencia de los circuitos en paralelo ).

En el transporte, algunos ejemplos recientes notados de la aplicación reciente del concepto han incluido el puente del río Nipigon en Canadá, donde una falla parcial del puente en enero de 2016 cortó por completo el tráfico por carretera entre el este de Canadá y el oeste de Canadá durante varios días porque se encuentra a lo largo de una parte del la autopista Trans-Canada, donde no hay una ruta de desvío alternativa para que los vehículos tomen; [4] y el puente ferroviario del río Norwalk en Norwalk , Connecticut , un antiguo puente giratorio que a veces se atasca al abrir o cerrar, interrumpiendo el tráfico ferroviario en elLínea del Corredor Noreste . [3]

El concepto de un solo punto de falla también se ha aplicado a los campos de la inteligencia. Edward Snowden habló de los peligros de ser lo que describió como "el único punto de falla": el único depósito de información. [5]

Sistemas de soporte vital [ editar ]

Un componente de un sistema de soporte vital que constituiría un único punto de falla debería ser extremadamente confiable.

Ver también [ editar ]

Conceptos [ editar ]

  • Redundancia  : duplicación de componentes críticos para aumentar la confiabilidad de un sistema.
  • Factor de bus  : una medida del riesgo de perder expertos técnicos clave
  • Ley de Lusser: la ley del  producto de probabilidad de los componentes de la serie

Aplicaciones [ editar ]

  • Interruptor de apagado  : mecanismo de seguridad para apagar rápidamente un sistema
  • Ingeniería de confiabilidad  : Subdisciplina de ingeniería de sistemas que enfatiza la confiabilidad en la gestión del ciclo de vida de un producto o sistema.
  • Ingeniería de seguridad  : disciplina de la ingeniería que asegura que los sistemas diseñados brinden niveles aceptables de seguridad.

En literatura [ editar ]

  • Talón de Aquiles  : debilidad crítica que puede conducir a la caída a pesar de la fuerza general
  • Hamartia  : el error del protagonista en la teoría dramática griega

Referencias [ editar ]

  1. ^ 1: Diseño de LAN a gran escala - Página 31, K. Dooley, O'Reilly, 2002
  2. ^ Gary S. Lynch (07 de octubre de 2009). Punto único de falla: las 10 leyes esenciales de la gestión de riesgos de la cadena de suministro . Wiley. ISBN 978-0-470-42496-4.
  3. ^ a b "Crucial, centenario ya veces atascado: el puente de Connecticut es clave para el corredor noreste" . Connecticut Public Radio , 8 de agosto de 2017.
  4. ^ "El puente del río Nipigon y otros cuellos de botella de Trans-Canada" . Global News , 11 de enero de 2016.
  5. ^ "Edward Snowden: la verdadera historia detrás de sus filtraciones de la NSA" . Telegraph.co.uk . Consultado el 13 de diciembre de 2016 .