O que é SMART e como usá-lo para prever falhas de HDD ou SSD

Muitos de nós experimentamos uma falha no disco rígido ou no SSD. Alguns de nós até tentaram descobrir mais sobre a confiabilidade dos discos rígidos e sua função de previsão oculta(hidden prediction function) que faz parte de uma tecnologia chamada SMART . Pode-se argumentar que o SMART não é tão confiável, pois não prevê falhas em todos os casos. Esse fato é parcialmente verdadeiro, mas o funcionamento interno real desse sistema de automonitoramento não é tão simples, então vamos examinar como o SMART funciona. Também mostraremos como verificar o status SMART do HDD(HDD SMART status) , bem como o status SMART(SMART status) da unidade de estado sólido :

O que é SMART (HDD e SSD)?

SMART é um sistema que monitora as informações internas do seu drive. (SMART is a system that monitors the internal information of your drive.)Seu nome inteligente(clever name) é na verdade um acrônimo para Self-Monitoring, Analysis, and Reporting Technology . SMART , também escrito como SMART , é uma tecnologia encontrada em HDDs e SSDs(HDDs and SSDs) . É independente do seu sistema operacional(operating system) , BIOS ou outro software.

O que a SMART faz por HDDs e SSDs(HDDs and SSDs) ?

O SMART(SMART) foi inventado porque os computadores precisavam de algo que pudesse monitorar o estado de integridade(health state) de seus discos rígidos. Isso significa, claramente, que a SMART deveria ser capaz de dizer se o seu disco rígido ou unidade de estado sólido está prestes a parar de funcionar(SMART should supposedly be able to tell you if your hard drive or solid-state drive is about to stop working) !

As informações de integridade da unidade são fornecidas pela SMART

Como a SMART faz isso? Você pode ficar tentado a pensar que a SMART pode adivinhar magicamente se sua unidade está saudável. 🙂 O que ele faz é uma história totalmente diferente. O SMART acompanha uma série de variáveis(SMART keeps track of a series of variables) ​​cujo número e tipo variam de drive para drive, que são indicadores de sua confiabilidade(indicators of its reliability) . Se você quiser ter uma ideia detalhada de todos os atributos SMART , pois existem cerca de 50 deles ( taxa de erro de(error rate) leitura bruta , tempo de rotação, erros incorrigíveis relatados, tempo de inicialização, contagem de ciclos(cycle count) de carga etc.) , visite esta página(visit this webpage) .

No entanto, saiba que, além de algumas tentativas singulares ( Google , Backblaze ), a maioria dos SMART . dados não estão documentados. O sistema fornece uma grande quantidade de dados internos. Ainda assim, há muitas inconsistências nas estatísticas porque muitos fabricantes de discos rígidos usam definições e medidas diferentes. Por exemplo, alguns fabricantes armazenam dados de tempo de energia em horas, enquanto outros os medem em minutos ou segundos. Além disso, eles não explicam quais dos vários atributos ou variáveis ​​merecem nossa atenção, fazendo-nos afogar em dados.

Antes de tentar entender quais atributos SMART são relevantes, primeiro temos que diferenciar os principais tipos de falhas de SSD e HDD: previsíveis e não previsíveis(SSD and HDD failures: predictable and non-predictable) .

Detalhes SMART para uma unidade de estado sólido

As falhas previsíveis(Predictable failures) incluem as avarias que aparecem com o tempo e são causadas por falhas na mecânica do disco ou danos na superfície do disco no caso de discos rígidos. Para unidades de estado sólido, falhas previsíveis podem incluir desgaste normal ao longo do tempo ou um grande número de tentativas de apagamento que falharam. Os problemas(Problems) pioram com o tempo e a unidade eventualmente falha.

Falhas não previsíveis(Non-predictable failures) são causadas por eventos repentinos, dos quais podemos citar, por exemplo, picos de energia repentinos ou danos inesperados aos circuitos dentro do disco rígido ou unidade de estado sólido. O que é importante entender é que a SMART só pode ajudá-lo a detectar falhas previsíveis(S.M.A.R.T. can only help you detect predictable failures) .

Agora que você tem um entendimento básico do que é e faz o SMART , vamos ver como verificar o (SMART)status SMART(SMART status) de suas unidades no Windows e também como ler e interpretar os detalhes do SMART :

Como verificar o status do SSD e do HDD SMART(SSD and HDD SMART status)

Em computadores e dispositivos Windows , a maneira mais fácil de ler dados SMART de um disco rígido ou de um SSD é usando aplicativos especializados. Existem alguns por aí, mas muitos deles são pouco desenvolvidos ou custam dinheiro(cost money) . De todos os aplicativos que podem ler dados SMART , o melhor e o que recomendamos que você use é o CrystalDiskInfo . É gratuito, capaz de ler atributos SMART e também é um dos poucos aplicativos que podem obter dados SMART tanto do IDE ( PATA ), SATA e NVMedrives, bem como de drives portáteis que estão usando e SATA , USB ou IEEE 1394 .

CrystalDiskInfo mostra informações detalhadas sobre uma unidade usando SMART

Outro excelente método de verificar o status SMART e os detalhes(SMART status and details) de um HDD ou SSD(HDD or SSD) é usar os aplicativos fornecidos pelo fabricante. Por exemplo, a maioria das unidades de estado sólido é acompanhada por aplicativos de suporte(support apps) que permitem verificar informações sobre elas, verificar sua integridade, executar diagnósticos e assim por diante. Esses aplicativos geralmente incluem opções para verificar o status SMART(SMART status) .

Os fabricantes de drives oferecem aplicativos que podem ler informações SMART

Uma terceira maneira de verificar o status SMART(SMART status) de sua unidade de disco rígido ou SSD(disk drive or SSD) é oferecida pelo Windows 10 . Ele não mostra detalhes, mas pode informar se o status SMART(SMART status) de suas unidades está OK ou não. Para verificar SMART , abra o prompt(Command Prompt) de comando e execute este comando: wmic diskdrive get model, status . O comando gera a lista de unidades conectadas ao seu PC e mostra o status SMART(SMART status) de cada uma delas.

O Windows 10 permite verificar o status SMART de suas unidades

Este último método para verificar o status SMART(SMART status) é provavelmente a maneira mais rápida no Windows 10 de verificar se suas unidades estão falhando.

Como executar um teste SMART de SSD ou HDD

Se você não estiver satisfeito com apenas ler o status SMART(SMART status) de suas unidades, também poderá executar um teste SMART de SSD ou HDD(SSD or HDD SMART test) . Isso é mais fácil dizer do que fazer porque você precisa de um aplicativo especializado para essa finalidade. Assim, consideramos que este é um assunto digno de um artigo à parte, ao qual pode aceder através deste link: Teste o seu HDD ou SSD(HDD or SSD) e verifique o seu estado de saúde(health status) .

Como ler valores e atributos SMART

O status(health status) de integridade do disco rígido é continuamente testado e monitorado com vários sensores. Os valores são medidos pelo uso de algoritmos típicos e, em seguida, os atributos correspondentes são ajustados de acordo com os resultados.

Em qualquer programa de monitoramento(monitoring program) SMART , você deve ver atributos que contêm pelo menos alguns destes campos:

  • Identificador:(Identifier:) a definição do atributo. Geralmente tem um significado padrão e é marcado com um número entre 1 e 250 (por exemplo, 9 é Power-on Count ). Ainda assim, todas as ferramentas de monitoramento e teste de disco(disk monitoring and testing tools) fornecem o nome e uma descrição textual do atributo.
  • Limiar:(Threshold:) o valor mínimo para o atributo. Se esse valor for atingido, sua unidade está prestes a falhar.
  • Valor:(Value:) valor atual do atributo. O algoritmo calcula esse número com base nos dados brutos. Um novo disco rígido deve ter um número alto, o máximo teórico (100, 200 ou 253 dependendo do fabricante), que diminui durante sua vida útil.
  • Pior:(Worst:) o menor valor do atributo já registrado.
  • Dados:(Data:) valores medidos brutos fornecidos por um sensor ou um contador. Esses são os dados usados ​​pelo algoritmo projetado pelo fabricante do HDD ou SSD(HDD or SSD) . Seu conteúdo depende do atributo e do fabricante da unidade. Usuários regulares devem pular este.
  • Flags: a finalidade do atributo. Isso geralmente é definido pelo fabricante e, portanto, varia(manufacturer and therefore varies) de unidade para unidade. Cada um dos atributos é crítico e pode prever uma falha iminente (por exemplo, contagem de setores realocados ID 5 ) ou estatística sem efeito direto no status (por exemplo, contagem de perda de energia(power loss count) inesperada ID 174 ).

Os atributos SMART são descritos por dados como ID, valor atual, pior valor e limite

Ao tentar entender o status de qualquer atributo SMART, verifique os valores desses três campos: valor, limite e sinalizadores(to understand the status of any S.M.A.R.T. attribute, check the values of these three fields: value, threshold, and flags) . Além disso, lembre-se de que, geralmente, valores menores são uma indicação de diminuição da confiabilidade(smaller values are an indication of a decrease in reliability) .

Como usar o SMART para prever a falha de um HDD ou SSD(HDD or SSD) (valores essenciais a serem verificados)

Nem todos SMART . os atributos são críticos para a previsão de falhas(failure prediction) . Os dois estudos acima mencionados sobre taxas de falha de disco rígido(drive failure) e outras fontes concordam que uma ajuda importante na identificação de unidades com falha são:

  • Contagens de setor realocadas(Reallocated sector counts) . A realocação acontece quando a lógica da unidade remapeia um setor danificado, como resultado de erros recorrentes de software ou hardware, para um novo setor físico de seus sobressalentes. Este atributo reflete o número de vezes que um remapeamento ocorreu. Se seu valor aumentar, é uma indicação de desgaste do HDD ou SSD.

  • Contagem de Setores Pendentes Atuais(Current Pending Sector Count) . Isso conta os setores "instáveis", ou seja, os danificados com erros de leitura que aguardam um remapeamento, uma espécie de sistema de "provação". Os algoritmos SMART têm entendimentos mistos sobre esse atributo específico, pois às vezes não é convincente. Ainda assim, pode fornecer um aviso prévio de possíveis problemas.

  • Erros incorrigíveis relatados(Reported Uncorrectable Errors) . É a contagem de erros impossíveis de recuperar, e é útil porque parece ter o mesmo significado para todos os fabricantes.

  • Apagar Contagem de Falhas(Erase Fail Count) . Este é um excelente indicador da morte prematura de uma unidade de estado sólido. Ele conta o número de tentativas de exclusão de dados com falha e um valor que aumenta informa que a memória flash dentro do SSD está próxima do fim de sua vida útil.

  • Contagem de nivelamento de desgaste(Wear Leveling Count) . Isso também é especialmente útil para SSDs. Os fabricantes definem a vida útil esperada de um SSD em seus dados SMART. A contagem de nivelamento de desgaste(Wear Leveling Count) é uma estimativa da integridade da sua unidade. Ele é calculado usando um algoritmo que leva em consideração o tempo de vida esperado predefinido e o número de ciclos (gravação, apagamento, etc.) que cada bloco de memória flash pode realizar antes de atingir seu fim de vida.

  • A temperatura do disco(Disk temperature) é um parâmetro altamente debatido. Ainda assim, considera-se que valores acima de 60°C podem reduzir a vida útil de um HDD ou SSD e aumentar a probabilidade de danos. Recomendamos o uso de um ventilador para diminuir a temperatura de suas unidades e, esperamos, prolongar sua vida útil.

Os valores SMART que estão acima do limite podem apontar para possíveis falhas futuras da unidade

O acima mencionado SMART . atributos são relativamente fáceis de interpretar. Se você notar um aumento em seus valores, é possível que sua unidade esteja falhando, então é melhor você começar a fazer backup. No entanto, embora estes sejam indicadores úteis de confiabilidade da unidade, não se esqueça de que eles não são infalíveis.

Nota histórica sobre SMART

O SMART(SMART) foi desenvolvido a partir do ano de 1992(year 1992) , embora você saiba agora que ele está incluído em todas as unidades de estado sólido e unidades de disco rígido modernas. Sua história abrange uma série de nomes como Predictive Failure Analysis ou IntelliSafe(Predictive Failure Analysis or IntelliSafe) e informações de todos os principais fabricantes de discos rígidos: IBM , Seagate , Quantum , Western Digital . Finalmente, sua documentação foi apresentada pela primeira vez em 2004 dentro do padrão Parallel ATA e recebeu revisões regulares posteriormente. A última foi lançada em 2011.

Há mais alguma coisa que você gostaria de saber sobre SSD e HDD SMART(SSD and HDD SMART) ?

Este foi nosso pequeno estudo sobre o funcionamento interno do SMART e suas habilidades para monitorar, testar e prever falhas de disco rígido. O principal ponto de vista que você deve lembrar é que este sistema de automonitoramento pode ajudá-lo a revisar o estado de saúde(health status) do seu HDD . Se você quiser usar esses dados SMART(S.M.A.R.T data) para ver se sua própria unidade apresenta problemas, leia os artigos recomendados neste tutorial. Além disso, para perguntas, use o formulário de comentários abaixo e vamos discutir.



About the author

Sou engenheiro de software com mais de 10 anos de experiência na indústria Xbox. Sou especialista em desenvolvimento de jogos e testes de segurança. Também sou um revisor experiente e tenho trabalhado em projetos para alguns dos maiores nomes dos jogos, incluindo Ubisoft, Microsoft e Sony. No meu tempo livre, gosto de jogar videogame e assistir a programas de TV.



Related posts