Por que meu disco rígido falhou ou travou tão rápido e sem motivo aparente?

Estima-se que mais de 90% de todas as novas informações produzidas no mundo estejam armazenadas em mídia magnética, a maior parte em discos rígidos. Apesar de sua importância, há relativamente pouco trabalho publicado sobre os padrões de falha das unidades de disco(failure patterns of disk drives) e os principais fatores que afetam sua vida útil. A maioria dos dados disponíveis é baseada na extrapolação de experimentos de envelhecimento acelerado ou em estudos de campo de tamanho relativamente modesto.

Por que meu disco rígido falhou ou travou

Além disso, estudos populacionais maiores raramente possuem infraestrutura para coletar sinais de saúde de componentes em operação, o que é uma informação crítica para análise detalhada de falhas.

Os clientes substituem as unidades de disco em taxas muito mais altas do que as sugeridas pelo tempo médio estimado entre falhas ( MTBF ) fornecido pelos fornecedores de unidades, de acordo com um estudo de cerca de 100.000 unidades realizado pela Carnegie Mellon University .

Falha no disco rígido

Um estudo da Carnegie Mellon examinou grandes sistemas de produção, incluindo sites de computação de alto desempenho e sites de serviços de Internet executando unidades SCSI , FC e SATA . As folhas de dados para essas unidades listaram MTBF entre 1 milhão e 1,5 milhão de horas, o que o estudo disse que deveria significar taxas anuais de falhas “de no máximo 0,88%”. No entanto, o estudo mostrou taxas de substituição anuais típicas entre 2% e 4%, “e até 13% observados em alguns sistemas”.

Então, o que isso significa para você, consumidor que compra discos rígidos e computadores com discos rígidos?

Tenho mais de 25 anos de experiência em engenharia, fabricação e desenvolvimento de software, então primeiro vamos examinar um aspecto importante dos processos de fabricação típicos de automóveis e aviões a discos rígidos e smartphones. O fabricante típico de qualquer produto final, na verdade, produz alguns dos componentes que compõem o produto final. Eles, de fato, terceirizam a fabricação e, muitas vezes, o projeto de quase todos os subcomponentes, dando ao fornecedor supervisão que varia de nenhuma até especificações, testes e supervisão expansivos. O fornecedor escolhido para fornecer o componente geralmente é o que oferece o menor lance, enquanto alguns fabricantes escolhem o melhor fornecedor com base no valor, que é uma combinação de preço, qualidade e confiabilidade.

Esse sistema de terceirização é frequentemente chamado de base de fornecedores em camadas. Um fornecedor de primeiro nível fornece diretamente ao fabricante do produto final. Os fornecedores do fornecedor de nível um são fornecedores de nível dois e, assim, descem a cadeia alimentar. Tecnicamente, no caso de um fabricante de disco rígido, eles, na verdade, são um fornecedor de primeira linha para o fabricante do computador. Esse sistema explica por que, quando o governo dos (Government)Estados (United) Unidos(States) estava lutando para salvar os fabricantes de automóveis dos EUA(US Automobile Manufacturers) , as pessoas diziam que, se fossem autorizados a falir, centenas de milhares de pessoas perderiam seus empregos. Referiam-se aos funcionários de todos os fornecedores de nível.

Em um sistema como esse, a qualidade do produto final é tão boa quanto o elo mais fraco da cadeia de suprimentos. Métodos de design e controle de qualidade muito(Very) complexos e rígidos são usados ​​pela maioria dos fornecedores para garantir a qualidade de seus produtos, mas, no final, ainda se resume ao potencial de erro humano. Mesmo as mais sofisticadas instalações de fabricação 24 horas por dia, 7 dias por semana, controladas por computador e robotizadas do mundo estão sujeitas a erro humano. A pessoa que programa o robô pode não estar se concentrando na tarefa, fazendo com que o robô coloque um microchip uma fração de micrômetro fora do alvo a cada 100 operações, fazendo com que seu disco rígido tenha problemas quando o computador idêntico de seu colega de trabalho estiver bem.

Falhas precoces como essa não são incomuns. É o que todas as garantias chamam de “defeitos de fabricação”. O termo dentro da indústria é Fracasso de Mortalidade Infantil(Infant Mortality Failure) ( FMI(IMF) ). As garantias têm um limite de tempo porque se destinam a protegê-lo contra IMFs . Na verdade, existem diferentes níveis de FMI(IMFs) . A maioria dos eletrônicos passa por algum tipo de teste geralmente chamado de burn-in. Isso está testando uma falha imediata ou uma falha nos primeiros minutos. Estes são causados ​​por defeitos de fabricação grosseiros que causam falhas catastróficas quase imediatamente.

Os IMFs(IMFs) mais incômodos são aqueles que chegam até você, o consumidor, funcionam perfeitamente por um curto período de tempo e, então, bam, está morto. Os fabricantes odeiam essas falhas porque agora sua opinião sobre o fabricante está manchada. Você nunca soube das falhas durante o burn-in e ficou feliz por não saber sobre elas, mas quando seu disco rígido morre na noite anterior a um prazo crítico, você fica balístico e exige uma compensação ao mundo. O custo dessa falha é de longo prazo e mais alto do que o custo de um novo disco rígido. Isso pode resultar em um cliente perdido para sempre. É por isso que nunca terei outro computador HP, mesmo que sejam ótimos computadores. Eu peguei um ruim e isso me manchou contra a HP para sempre.

Relacionado(Related) : Disco rígido limpou-se! O que eu faço ?

Então o que você pode fazer para se proteger?

Eu, pessoalmente, sempre faço muita pesquisa antes de qualquer nova compra de eletrônicos. O IMF(IMF) pode ser um problema persistente com um fabricante ou modelo até que a causa raiz do problema seja encontrada e corrigida. Pode até ser uma falha de projeto e não um problema de fabricação. Recentemente, comprei uma nova TV HD de tela grande e pensei que queria o Plasma 3D top de linha da Panasonic(Panasonic 3D) , até que aprendi lendo comentários de várias fontes que os modelos de 2010 experimentam perda precoce (dentro de 3 meses) de níveis de preto e não o suficiente informações estavam disponíveis para determinar se ele foi corrigido nos modelos de 2011. Então comprei minha segunda opção.

A outra coisa mais óbvia que você pode fazer especificamente com um disco rígido de computador é fazer backup de seus dados ou criar imagens de todo o seu sistema. Eu pessoalmente uso um produto chamado Acronis True Image . Eu faço uma imagem de backup de todo o meu sistema e depois faço backups incrementais todas as noites. Eu configurei para manter 10 incrementos anteriores para que eu sempre possa redefinir para uma versão recente anterior. Eu faço isso em um disco rígido(Hard Drive) externo de 1 TB dedicado . E se esse disco rígido falhar, você diz? Bem, a probabilidade de o disco rígido do seu computador e o seu disco rígido externo falharem ao mesmo tempo é remoto, mas eu possuo meu próprio negócio, então tenho um disco rígido externo redundante no qual faço backups redundantes apenas por segurança.

Eu também recomendo que você compre um protetor contra sobretensão de boa qualidade, não o tipo que você encontra no Walmart ao lado dos cabos de extensão, mas uma unidade de boa qualidade de um varejista como a Best Buy ou qualquer varejista de suprimentos para computadores. EU USO UMA unidade Belkin que custa cerca de $ 40 USD .

Marque isso se você precisar de algum Freeware para monitorar o disco rígido para possíveis falhas(Freeware to Monitor Hard Disk for Potential Failure) .(Check this if you need some Freeware to Monitor Hard Disk for Potential Failure.)

O autor deste Guest Post, Randy L. Miller é o CEO da Alagad Incorporated.(The author of this Guest Post, Randy L. Miller is the C.E.O of Alagad Incorporated.)



About the author

Sou engenheiro de hardware e desenvolvedor de software com mais de 10 anos de experiência nas plataformas Apple e Google. Minhas habilidades estão no desenvolvimento de soluções eficientes e fáceis de usar para problemas difíceis de engenharia. Eu tive experiência com dispositivos MacOS e iOS, bem como com controles de teclado e mouse. Nas horas vagas, gosto de nadar, assistir tênis e ouvir música.



Related posts