opinion

Cómo gestionaremos nuestros datos en 2021

Paul Speciale, director de productos en Scality

22 DE diciembre DE 2020. 10:01H Paul Speciale

f80ba3c07146acf540f59a116db119e2.JPG

En los próximos años el desarrollo e implementación de aplicaciones y servicios digitales utilizando enfoques nativos de la nube será abrumador. Según IDC para 2023 serán más de 500 millones, lo que equivale el número de todas las aplicaciones desarrolladas en los últimos 40 años.

Es decir, las aplicaciones nativas de la nube y la infraestructura de almacenamiento dominarán las TI de las empresas.

La mayoría de estas aplicaciones estarán dirigidas a casos de uso de transformación digital específicos de cada industria. Esta explosión de nuevas aplicaciones y servicios digitales definirá los nuevos requisitos competitivos mínimos en cada sector. El mundo de la tecnología de la información se está convirtiendo rápidamente en nativo de la nube y en contenedores como el nuevo principio y modelo para el desarrollo de aplicaciones y servicios de infraestructura de nube subyacentes.

Si nos centramos en el sector del almacenamiento, la tendencia de los contenedores es un importante punto de inflexión que transformará radicalmente las arquitecturas y los despliegues de soluciones. Su impacto será similar al de la virtualización de servidores hace casi veinte años y al del comienzo de la computación en nube hace diez años. En 2021, los proveedores de almacenamiento se adaptarán a este cambio en los modelos de aplicación e infraestructura de la nube creando soluciones para hacer frente a las crecientes demandas de escala y agilidad de los servicios basados en contenedores.

¿Pero cómo deberán ser estas aplicaciones contenerizadas?, sin duda requerirán varios tipos de almacenamiento para satisfacer una serie de requisitos, desde volúmenes y registros de arranque, bases de datos transaccionales, datos de aplicaciones sobre archivos tradicionales y nuevas API de objetos, así como copias de seguridad y archivos a largo plazo. Surgirán nuevas soluciones de almacenamiento centradas en contenedores para hacer converger los volúmenes persistentes de tipo Interfaz de Almacenamiento en Contenedores (CSI) para aplicaciones tradicionales centradas en datos, así como el almacenamiento de objetos y las copias de seguridad. Esto reducirá drásticamente la complejidad de las implantaciones de Kubernetes a gran escala, ya que estas cargas de trabajo suelen representar el 80% de las necesidades de almacenamiento, medidas en términos de capacidad. Esta nueva generación de almacenamiento de datos ayudará a simplificar los nuevos y únicos retos de las aplicaciones nativas de la nube.

Estamos seguros de que el almacenamiento de objetos se convertirá en un modelo de almacenamiento de facto para los lagos de datos.

Según Research and Markets los lagos de datos se convertirán en un mercado de más de 16.500 millones de euros de aquí a 2025. Nosotros mismos estamos viendo este crecimiento en nuestros propios clientes, gracias a la información que les ofrecen los lagos de datos las compañías de seguros están optimizando las primas, las instituciones de servicios financieros están luchando contra el fraude y las compañías biofarmacéuticas están secuenciando los genes. Para aprovechar plenamente esta información, las organizaciones requieren una capa de almacenamiento fundamental que haga que los datos sean accesibles y útiles.

El almacenamiento de objetos se convertirá en la interfaz de almacenamiento dominante para aplicaciones analíticas como Splunk, Vertica, Weka, Elastic, Cloudera, Spark y muchas otras.

Yo diría que esto sucede principalmente por cinco razones. La capacidad de estas aplicaciones de consumir datos directamente usando protocolos compatibles con Hadoop como S3A, aprovechando así la popular API AWS S3. El hecho de que los conjuntos de datos semiestructurados y no estructurados que incluyen imágenes, audio, PDF, archivos de diseño/CAD, etc. encajan de forma natural en un almacén de objetos, pero serían bastante difíciles de manejar en una base de datos. Que el espacio de nombres de objetos plano (no jerárquico) e ilimitado facilita que las aplicaciones analíticas gestionen miles de millones de objetos a niveles efectivamente ilimitados, sin preocuparse por los límites del número de directorios o archivos por directorio. La capacidad de las soluciones de almacenamiento de objetos para separar el nivel de almacenamiento del nivel de computación de la aplicación que alberga la aplicación analítica, lo que permite que los recursos de rendimiento y capacidad se escalen de forma independiente, a diferencia de los sistemas heredados, en los que ambos están estrechamente acoplados, lo que obliga a escalarlos al mismo ritmo. Y, por último, que características como el bloqueo de objetos y el versionado son medidas esenciales para proteger la valiosa información almacenada en los lagos de datos contra el número cada vez mayor de ataques a la ciberseguridad.

La gestión de los datos de las nubes híbridas será ampliamente aceptada, porque ofrece a las empresas lo mejor de las nubes públicas (escalabilidad bajo demanda, servicios ricos y agilidad) y las ventajas de la infraestructura en las instalaciones (privacidad, seguridad, rendimiento y control). En el caso de las aplicaciones centradas en los datos, se pueden obtener enormes beneficios al acelerar el tiempo de comercialización, aumentar el acceso a los datos y reducir el Capex y el Opex. Los casos de uso de datos abarcan desde el archivo de datos en la nube hasta la explosión de datos y la continuidad del negocio (recuperación de datos en caso de desastre, específicamente).

La recuperación de desastres (DR) a través de dos centros de datos físicos ya no será necesaria en 2021. Con las soluciones híbridas de DR en la nube que gestionan copias sincronizadas de datos críticos en las instalaciones y en la nube pública, los líderes de TI ahorrarán miles, sino millones, de euros sin los costes necesarios para mantener y dar servicio a dos ubicaciones remotas para la DR.

El nuevo año verá una nueva generación de almacenamiento flash de alta densidad que ofrecerá una combinación óptima de alto rendimiento y precios más bajos, lo que lo hace adecuado para el almacenamiento a escala de archivos y objetos de alta capacidad.

Por otro lado a medida que los datos crecen, la necesidad de un almacenamiento de datos que escale - tanto en capacidad como en la amplitud de aplicaciones que soporta - se convierte en una prioridad cada vez mayor.

Según el IDC, el 80% de los datos mundiales estarán desestructurados para el 2025.

Las aplicaciones nativas de la nube consumen e interactúan de forma natural con el almacenamiento a través de las API, para lo cual el modelo de facto es ahora el almacenamiento de objetos a través de interfaces populares como la API de AWS S3. Por esta razón, predigo que los sistemas de almacenamiento que combinan modelos de archivos y objetos en sistemas unificados únicos se convertirán en los dominantes en la empresa a partir de 2021.

Por último, apostamos por la adopción de una combinación de servicios para conectar y asegurar las cargas de trabajo será casi imprescindible ya que se están desplegando aplicaciones complejas y distribuidas en las regiones de la nube, en los centros de datos centrales de las instalaciones y en las ubicaciones de perímetro en las máquinas virtuales existentes y en los nuevos servicios basados en contenedores. La comunicación segura entre estos servicios y el acceso controlado a los servicios de almacenamiento se convierte en un reto cada vez mayor.

2021 traerá consigo una mayor adopción de enfoques de "combinación de servicios" para la comunicación segura de redes y la autenticación y el control de acceso tanto para la conectividad de la carga de trabajo como hacia el perímetro. A diferencia de las credenciales de autenticación tradicionales basadas en el host que eran de larga duración, ahora nos movemos hacia las identidades de instancia de servicio con cuentas de servicio de corta duración y delegación y autorización más granular. Esto introduce gradualmente redes de "confianza cero" (encabezadas por el enfoque BeyondCorp de Google) en las que las políticas de red pueden codificarse y aplicarse/desplegarse sistemáticamente con una granularidad fina.

Omar López: "Bitcoin está un nivel por encima del resto de las criptomonedas"