El almacenamiento de instancia única (SIS) es la capacidad de un sistema para tomar múltiples copias de contenido y reemplazarlas por una sola copia compartida. Es un medio para eliminar la duplicación de datos y aumentar la eficiencia. SIS se implementa con frecuencia en sistemas de archivos , software de servidor de correo electrónico , copias de seguridad de datos y otro software informático relacionado con el almacenamiento. El almacenamiento de instancia única es una variante simple de la deduplicación de datos . Si bien la deduplicación de datos puede funcionar a nivel de segmento o subbloque, el almacenamiento de instancia única funciona a nivel de archivo completo y elimina las copias redundantes de archivos completos o mensajes de correo electrónico. [1]
Concepto
En el caso de un servidor de correo electrónico , el almacenamiento de instancia única significaría que una única copia de un mensaje se mantiene dentro de su base de datos mientras que los buzones individuales acceden al contenido a través de un puntero de referencia . Sin embargo, existe la idea errónea de que el beneficio principal del almacenamiento de instancia única en los servidores de correo es la reducción de los requisitos de espacio en disco. La verdad es que su principal beneficio es mejorar en gran medida la eficiencia de entrega de los mensajes enviados a grandes listas de distribución. En un escenario de servidor de correo, los ahorros de espacio en disco del almacenamiento de instancia única son transitorios y disminuyen muy rápidamente con el tiempo. [ cita requerida ]
Cuando se utiliza junto con el software de respaldo, el almacenamiento de instancia única puede reducir la cantidad de medios de archivo necesarios, ya que evita almacenar copias duplicadas del mismo archivo. A menudo, se instalan archivos idénticos en varios equipos, por ejemplo , archivos del sistema operativo . Con el almacenamiento de instancia única, solo se escribe una copia de un archivo en el medio de respaldo, lo que reduce el espacio. Esto se vuelve más importante cuando el almacenamiento está fuera del sitio y en el almacenamiento en la nube , como Amazon S3 . En tales casos, se ha informado que la deduplicación puede ayudar a reducir los costos de almacenamiento, los costos de ancho de banda y las ventanas de respaldo hasta en 10: 1. [2]
Novell GroupWise se creó con un almacenamiento de instancia única, lo que explica su gran capacidad.
Los archivos de imagen ISO CD / DVD se pueden optimizar para usar SIS para reducir el tamaño de una compilación de CD / DVD (si hay suficientes archivos duplicados) para que quepan en medios más pequeños.
SIS está relacionado con la búsqueda de duplicación de archivos en todo el sistema y varias herramientas de detección de instancias de archivos, como la aplicación P2P BearShare (versiones 5.ny posteriores), pero se diferencia en que SIS reduce la utilización del almacenamiento automáticamente y crea y retiene enlaces simbólicos, mientras que Bearshare permite el uso manual. eliminación de duplicados y sistema de archivos de nivel de usuario asociado, tipo de enlaces de iconos del Explorador de Windows .
Microsoft
SIS se introdujo con la función Servicios de instalación remota de Windows 2000 Server . Un servidor típico puede contener diez o más configuraciones de instalación únicas (quizás con diferentes controladores de dispositivos o paquetes de software ) pero quizás solo el 20% de los datos pueden ser únicos entre configuraciones. [3] Microsoft afirma que "SIS funciona buscando un volumen de disco duro para identificar archivos duplicados. Cuando SIS encuentra archivos idénticos, guarda una copia del archivo en un repositorio central, llamado SIS Common Store, y reemplaza otras copias con punteros a las versiones almacenadas ". [4] Los archivos se comparan únicamente por sus funciones hash ; Los archivos con diferentes nombres o fechas se pueden consolidar siempre que los datos en sí sean idénticos. [3] Windows Server 2003 Standard Edition tiene capacidades SIS pero está limitado a las instalaciones del sistema operativo OEM. [ cita requerida ]
El formato de imágenes de Windows basado en archivos introducido en Windows Vista también admitía el almacenamiento de instancia única. El almacenamiento de instancia única fue una característica de Microsoft Exchange Server desde la versión 4.0 y también está presente en Windows Home Server de Microsoft . Desduplica los archivos adjuntos solo en Exchange 2007 y se eliminó por completo en Microsoft Exchange Server 2010. [5] Microsoft anunció Windows Storage Server 2008 (WSS2008) [6] con almacenamiento de instancia única el 1 de junio de 2009, y afirma que esta función no está disponible. en Windows Server 2008 . [6]
La función está oficialmente obsoleta desde Windows Server 2012, cuando se introdujo un nuevo y más potente mecanismo de deduplicación de datos basado en fragmentos. Permite deduplicar archivos con contenido similar siempre que tengan tramos de datos idénticos. Este mecanismo es más poderoso que el SIS. [7] Desde Windows Server 2019, la función es totalmente compatible con ReFS. [8]
Ver también
Referencias
- ^ Explicar las tasas de deduplicación y el almacenamiento de instancia única a los clientes . George Crump, Almacenamiento Suiza
- ^ Deduplicación + Amazon S3 le permitirá ahorrar tiempo y dinero . Libro blanco: publicado en junio de 2008
- ^ a b Douceur, John (JD); Goebel, David; Corbin, Scott; Bolosky, Bill (agosto de 2000). "Almacenamiento de instancia única en Windows 2000" (PDF) . Investigación de Microsoft . Grupo de investigación y tecnología Balder de Microsoft .
- ^ Almacenamiento de instancia única en Microsoft Windows Storage Server 2003 R2 Archivado 2007-01-04 en Wayback Machine : Informe técnico: Publicado en mayo de 2006
- ^ [1] El blog del equipo de Exchange, Microsoft Corp.
- ^ a b Windows Storage Server 2008 en Microsoft
- ^ FileCAB-Team (10 de abril de 2019). "Introducción a la deduplicación de datos en Windows Server 2012" . Comunidad tecnológica de Microsoft .
- ^ "Interoperabilidad de la deduplicación de datos" . docs.microsoft.com .