O armazenamento indefinido aborda o problema de que os dados arquivados podem precisar ser mantidos muito além da vida útil da tecnologia para a qual foram escritos
Por centenas de anos, qualquer organização que necessários para armazenar informações dependiam de uma tecnologia testada e comprovada: o papel. Mas desde o advento da computação e do armazenamento de dados digitais, mais e mais dados foram capturados e armazenados eletronicamente em arquivos digitais.
- Carol Sliwa
-
armazenamento em camadas
- Por: Robert Sheldon
armazenamento secundário
- Robert Sheldon
Por:
Mas agora as organizações precisam manter os dados arquivados por mais tempo – por motivos comerciais e regulatórios – a tecnologia de armazenamento pode acompanhar ?
Com uma gestão cuidadosa, os arquivos em papel duram décadas, se não séculos. Nenhum sistema de computador tem mais de 80 anos, mas existem indústrias que enfrentam a perspectiva de arquivar dados por 100 anos ou mais.
E, com a vida útil operacional de um disco rígido padrão de apenas três a cinco anos, os departamentos de TI precisam saber como armazenar dados para as gerações futuras: o chamado armazenamento indefinido.
Não há padrão da indústria para indefinido armazenamento, pois depende muito do caso de uso. Em termos práticos, “indefinido” não precisa significar “para sempre”. Em vez disso, significa manter os dados sem um período de retenção especificado.
Em termos práticos, no entanto, a maioria dos CIOs interpretaria isso como
O desafio é que poucos meios de armazenamento eletrônico são projetados para manter os dados seguros e acessível por períodos muito longos.
Os fabricantes especificam a vida útil esperada de componentes como discos rígidos ou SSDs. Um disco rígido típico de “consumidor” deve durar de três a cinco anos. As unidades de nível empresarial podem durar um pouco mais, talvez sete anos. Os SSDs são teoricamente mais duráveis, com uma vida útil de até 20 anos.
No entanto, muito dependerá de como a mídia de armazenamento é usada. Os SSDs se desgastarão mais rapidamente se o aplicativo fizer muitas gravações, por exemplo.
E, como explica Tony Lock da Freeform Dynamics, as matrizes de armazenamento podem, teoricamente, continuar funcionando para sempre. Como os dados são armazenados por mais tempo, torna-se uma questão de gerenciamento de hardware, monitoramento de falhas e troca de componentes à medida que envelhecem.
“Existem tempos de vida em equipamentos”, diz ele. “À medida que o kit envelhece, você precisa aceitar que haverá mais chances de falha. Quão importante é essa informação para você e que tipo de proteção de dados você adiciona?”
Os sistemas RAID no local são projetados para adicionar exatamente essa proteção. E os provedores de nuvem “hiperescaladores”, que usam grandes quantidades de hardware de baixo custo, até trocam corredores inteiros ou mesmo datacenters inteiros quando o hardware se aproxima do fim de sua vida útil.
Cada vez mais, isso permite que clientes e provedores de serviços em nuvem troquem mídia tradicional, mas menos flexível, de longo prazo, como unidades ópticas ou fita magnética. A fita, em particular, precisa de um gerenciamento físico cuidadoso se for usada para armazenamento de longo prazo.
Por que precisamos de armazenamento indefinido ?
Como organizações buscam extrair mais valor de seus dados e os custos de armazenamento caem, há uma tendência clara de manter mais dados por mais tempo. As empresas podem querer usar dados para análises avançadas ou para treinar sistemas de inteligência artificial.
Também existem exigências regulatórias para manter os dados por mais tempo. Os serviços de saúde e financeiros são apenas duas áreas em que as organizações podem ser obrigadas a manter registros durante toda a vida do cliente ou paciente e vários anos depois disso.
No Reino Unido, por exemplo, o registro de um paciente deve ser mantido por 10 anos após a morte. As organizações que precisam de uma visão 360° do cliente, de acordo com as leis de prevenção de fraudes, também precisarão manter os dados por mais tempo.
Mesmo os dados do setor educacional, como transcrições de graduação, precisam de retenção de longo prazo. A Universidade de Manchester, por exemplo, possui registros eletrônicos de seus alunos desde 2007 e registros em papel anteriores a 1978.
De forma mais ampla, fabricantes, distribuidores e varejistas precisam manter a origem do produto e as informações de segurança por mais tempo, por razões ambientais e de segurança.
Uma vida útil de 40 a 50 anos não é incomum em equipamentos industriais ou de transporte. Os operadores precisam acessar os dados de manutenção para manutenção ou em caso de falhas inesperadas.
Os sistemas de TI usados para manter os equipamentos na década de 1980 são muito diferentes daqueles em uso hoje, e aqueles que usaremos daqui a 40 anos serão diferentes novamente.
“Se você olhar para trás na história, 80 anos atrás, não tínhamos esse problema. Era um problema de papel”, diz Patrick Smith, diretor de tecnologia de campo para EMEA no fornecedor Pure Storage.
“Avance mais 80 anos e você esperará ver várias mudanças de paradigma nesse período.”
- E a necessidade de armazenar dados por mais tempo está associada a conjuntos de dados crescentes, como Smith descreve, com cada subconjunto de dados, como componente, fabricante, localização , materiais, processo de fabricação e datas somando-se ao aumento exponencial. O desafio é criar maneiras de armazenar dados que possam lidar com esse crescimento, bem como com o ciclo típico de atualização de hardware, sem a necessidade de mover dados em massa a cada três a cinco anos.
“Se você olhar para o mundo da saúde, o objetivo é armazenar os dados em um formato que não esteja vinculado a nenhum pacote de software específico para que possamos recuperá-lo no futuro”, diz Smith.
É provável que isso signifique um nível maior de abstração entre hardware e dados, bem como novas tecnologias de armazenamento de dados.
Opções para armazenamento indefinido
As opções para armazenar dados além da vida útil projetada do equipamento de TI atual variam do simples – bom gerenciamento de hardware e garantia de redundância – t o ciência de ponta.
Entre as opções mais extremas estão o uso dados gravados a laser em vidro, desenvolvido pela Microsoft como Project Silica e armazenamento baseado em DNA. Isso, se puder ser dimensionado, promete armazenamento durável de capacidade muito alta.
Mas, no curto prazo, a ênfase está em melhorar a durabilidade da mídia de armazenamento, como flash, e garantir que aplicativos futuros possam ler dados da mídia de armazenamento atual. Mesmo que as equipes de TI possam copiar – e continuar copiando – dados para mídias mais novas, isso é de pouca utilidade se os dados não puderem ser lidos.
Por esse motivo, a indústria desenvolveu formatos comuns, como PDF/A (que remonta a 2005) e dados autodeclaratórios, como o autocontido formato de retenção de informações, ou
SIRF.
Esses formatos de dados permitem a obsolescência do software. Os diretores de informação podem explorar o fato de que o armazenamento de dados por mais tempo está se tornando mais fácil.
“Se você olhar para os dados cinco, 10, 15, 40 ou 100 anos à frente, a plataforma será diferente, o hardware será diferente, o software será diferente”, diz Lock da Freeform. “Isso mesmo que você possa ver fisicamente os bits e bytes.”
Esses formatos de dados permitem a obsolescência do software. Os diretores de informação podem explorar o fato de que o armazenamento de dados por mais tempo está se tornando mais fácil.
“Se você olhar para os dados cinco, 10, 15, 40 ou 100 anos à frente, a plataforma será diferente, o hardware será diferente, o software será diferente”, diz Lock da Freeform. “Isso mesmo que você possa ver fisicamente os bits e bytes.”
Leia mais sobre hardware de armazenamento de computador
arquivamento de e-mail
Por: Garry Kranz
Por:
Por: Garry Kranz
Por: