Almacenamiento en niveles automatizado (también almacenamiento en niveles automatizado) es la progresión o degradación automatizada de datos en diferentes niveles (tipos) de dispositivos y medios de almacenamiento. El movimiento de datos se realiza de forma automatizada con la ayuda de un software o firmware integrado y se asigna a los medios relacionados de acuerdo con los requisitos de rendimiento y capacidad. Las implementaciones más avanzadas incluyen la capacidad de definir reglas y políticas que dictan si los datos se pueden mover entre los niveles y cuándo, y en muchos casos proporciona la capacidad de fijar datos a los niveles de forma permanente o durante períodos de tiempo específicos. Las implementaciones varían, pero se clasifican en dos categorías amplias: implementaciones puramente basadas en software que se ejecutan en procesadores de uso general que admiten la mayoría de las formas de medios de almacenamiento de uso general y almacenamiento en niveles automatizado integrado controlado por firmware como parte de un sistema de almacenamiento integrado cerrado como un disco SAN. formación. Las arquitecturas de almacenamiento definido por software normalmente incluyen un componente de almacenamiento por niveles como parte de sus funciones principales.
En la definición más general, el almacenamiento en niveles automatizado es una forma de gestión de almacenamiento jerárquica. Sin embargo, el término almacenamiento en niveles automatizado ha surgido para adaptarse a las formas más nuevas de migración de datos optimizada para el rendimiento en tiempo real impulsada por la proliferación de discos de estado sólido y memoria de clase de almacenamiento. Además, cuando los sistemas HSM tradicionales actúan sobre archivos y mueven datos entre niveles de almacenamiento en un lote, programado como la moda, los sistemas de niveles de almacenamiento automatizados son capaces de operar a nivel de subarchivo tanto en modo por lotes como en tiempo real. En el caso de este último, los datos se mueven casi tan pronto como ingresan al sistema de almacenamiento o se reubican en función de sus niveles de actividad en cuestión de segundos después de que se accede a los datos, mientras que los niveles más tradicionales tienden a operar en un horario por hora, diario o incluso semanal. En el sitio web de SNIA se encuentran disponibles más antecedentes sobre las diferencias relativas entre HSM, ILM y el almacenamiento en niveles automatizado. [1] También se puede encontrar una comparación general de diferentes enfoques en este 'artículo comparativo sobre almacenamiento en niveles automático' [2] .
Almacenamiento en niveles automatizado basado en SO y software
La mayoría de los proveedores de almacenamiento en niveles automatizados de software orientado al servidor ofrecen la clasificación por niveles como un componente de una oferta de pila de virtualización de almacenamiento general, un ejemplo es Microsoft con sus espacios de almacenamiento por niveles. [2] Sin embargo, la organización en niveles automatizada se está convirtiendo en una parte común de los sistemas operativos estándar de la industria, como Linux y Microsoft Windows, y en el caso de las PC de consumo, Apple OSX con Fusion Drive. [3] Esta solución permitió combinar una única SSD y una unidad de disco duro en una única unidad de almacenamiento por niveles automatizada que aseguró que los datos a los que se accede con más frecuencia se almacenaran en la parte SSD del disco virtual. Enmotus introdujo una versión más independiente del sistema operativo que admite la organización en niveles en tiempo real con su producto FuzeDrive para sistemas operativos Windows, extendiendo el soporte a ofertas de memoria de clase de almacenamiento como dispositivos NVDIMM y NVRAM. [4]
Almacenamiento por niveles basado en SAN
Un ejemplo de almacenamiento por niveles automatizado en una matriz de almacenamiento de hardware es una función llamada Progresión de datos de Compellent Technologies. Data Progression tiene la capacidad de mover de forma transparente bloques de datos entre diferentes tipos de unidades y grupos RAID como RAID 10 y RAID 5. Los bloques son parte del "mismo volumen virtual incluso si abarcan diferentes grupos RAID y tipos de unidades. Compellent puede hacer esto porque mantienen metadatos sobre cada bloque, lo que les permite realizar un seguimiento de cada bloque y sus asociaciones ". [5] Otro ejemplo sólido de organización en niveles basada en SAN es el almacenamiento en niveles autónomo de DotHill, que mueve datos entre niveles de almacenamiento dentro de la matriz de discos SAN con decisiones que se toman cada pocos segundos ". [6]
Almacenamiento en niveles automatizado frente al almacenamiento en caché SSD
Si bien las soluciones de niveles y el almacenamiento en caché pueden parecer iguales en la superficie, las diferencias fundamentales radican en la forma en que se utiliza el almacenamiento más rápido y los algoritmos utilizados para detectar y acelerar los datos a los que se accede con frecuencia.
El almacenamiento en caché SSD funciona de manera similar a los cachés SRAM-DRAM, es decir, hacen una copia de los bloques de datos a los que se accede con frecuencia, por ejemplo, en tamaños de página de caché de 4K, y almacenan la copia en el SSD y usan esta copia en lugar de la fuente de datos original en el más lento almacenamiento backend. Cada vez que se produce una lectura de almacenamiento, el software de almacenamiento en caché busca si ya existe una copia de estos datos en la caché y usa esa copia, si está disponible. De lo contrario, los datos se leen desde el almacenamiento del disco duro más lento.
La clasificación por niveles, por otro lado, funciona de manera muy diferente. Utilizando el caso específico de los SSD, una vez que los datos se identifican como de uso frecuente, los bloques de datos identificados se mueven en segundo plano al SSD y no se copian, ya que el SSD se utiliza como un nivel de almacenamiento principal, no como un área de copia de apartar la vista. Cuando se accede posteriormente a los datos, las E / S ocurren en el rendimiento nativo de los SSD o cerca del mismo. [7]
Ver también
Referencias
- Russ Taddiken - Arquitecto senior de almacenamiento (2006). Automatización del movimiento de datos entre niveles de almacenamiento. Obtenido del sitio web de UW Records Management: https://web.archive.org/web/20060628054613/http://www.compellent.com/
- ^ http://www.snia.org/sites/default/education/tutorials/2012/spring/storman/LarryFreeman_What_Old_Is_New_Again.pdf
- ^ https://redmondmag.com/articles/2013/08/30/windows-storage-tiering.aspx?m=1
- ^ "Sitio web de rendimiento de Apple iMac" 24 de octubre de 2012.
- ^ http://cdn2.hubspot.net/hub/486631/file-2586107985-pdf/PDFs/20111129_S2-102_Mills.pdf?t=1447892865729
- ^ Tony Asaro, Computerworld. "Almacenamiento por niveles inteligente e inteligente". Archivado el 24 de mayo de 2010en la Wayback Machine el 19 de enero de 2009.
- ^ "Solución de almacenamiento de datos híbrido con niveles de SSD y HDD" . Archivado desde el original el 6 de septiembre de 2015 . Consultado el 18 de enero de 2016 .
- ^ [1] "Nivelación frente a almacenamiento en caché en sistemas de almacenamiento basados en flash"