Sprzęt

Jak sprawdzić czas pracy dysku i oszacować jego żywotność?

dysk komputerowy

Dyski twarde są jednym z głównych nośników danych, to właśnie one zapewniają użytkownikom miejsce pod magazynowanie filmów, gier, aplikacji. Urządzenia tego typu z czasem zużywają się. Producenci w specyfikacjach określają przybliżoną żywotność dysku, która w zależności od typu dysku, jest wyrażona albo poprzez MTBF (ang. Mean Time Between Failures) – czyli średni czas bezawaryjnej pracy, albo poprzez parametr TBW (ang. Total Bytes Written), czyli całkowitą ilość danych, jaką możemy zapisać na nośniku. W obydwu przypadkach (HDD i SSD), czym większa wartość, tym teoretycznie większa żywotność, przy czym MTBF bardziej opiera się na oszacowaniu, ponieważ nie da się precyzyjnie przewidzieć ilości godzin, które dysk bezawaryjnie przepracuje. Powstaje pytanie, jak odczytać parametr o czasie pracy dysku i inne ważne wskaźniki, aby oszacować jego żywotność? Na to pytanie odpowiadamy poniżej.

SMART dysku twardego – co to takiego?

Oszacowanie żywotności dysku nie byłoby możliwe bez mechanizmu SMART (ang. Self-Monitoring, Analysis and Reporting Technology), który zaszyty jest w firmware i odpowiada za zbieranie informacji o parametrach pracy dysku, które następnie są wykorzystywane do oceny jego stanu i przewidywania możliwych awarii. Najważniejsze parametry w kontekście żywotności uzależnione są od typu dysku, występują także różnice między parametrami klasycznych dysków talerzowych HDD, a SSD.

Jakie są różnice pomiędzy dyskiem SSD a HDD?

Dyski SSD ( ang. Solid State Drive) i HDD (ang. Hard Disk Drive) to dwa kompletnie odmienne rodzaje nośników danych, które różnią się zarówno pod względem technologii wykonania, jak i wydajności. Główną różnicą pomiędzy dyskiem SSD a HDD jest to, że SSD nie posiada żadnych ruchomych części, co sprawia, że są one bardziej odporne na wstrząsy oraz szybsze w działaniu. Z kolei HDD działają na zasadzie talerzy, które obracają się umożliwiając odczyt oraz zapis danych. W wyniku tych różnic SSD cechują się lepszą wydajnością, niższym poborem energii oraz dłuższą żywotnością w porównaniu z HDD. Jednakże, wyższa wydajność SSD wiąże się zwykle z wyższą ceną, przez co HDD często są preferowane jako bardziej ekonomiczne rozwiązania, zwłaszcza gdy chodzi o przechowywanie dużych ilości danych (magazyny danych). Ponadto HDD są zwykle dostępne w większych pojedynczych pojemnościach niż SSD. Na zdjęciu z lewej wnętrze dysku SSD, po prawej HDD.

HDD i SSD - wnętrza dysków

W przypadku dysków HDD istotnymi parametrami w ocenie stanu dysku będą:

  • Raw Read Error Rate – to parametr SMART określający ilość błędów odczytu w trybie „surowym”. Błędy te mogą wynikać z uszkodzenia powierzchni dysku lub z problemów z odczytem danych. Odczytywanie „surowe” to proces, w którym dysk twardy dokonuje wielu prób odczytu danych z wielu sektorów, a każda próba ma przypisaną wartość RAW. Liczba odczytów pomnożona przez przypisaną wartość RAW daje wartość Raw Read Error Rate. Im niższa jest liczba błędów, tym mniejsze jest ryzyko utraty danych. Jednak wartość ta może różnić się w zależności od modelu dysku twardego i sposobu jego użytkowania. Dlatego nie zawsze należy ufać jedynie temu parametrowi, ale także monitorować wszystkie inne wartości SMART, aby wcześniej wykryć problemy z dyskiem twardym.
  • Start/Stop Count – jest kolejnym ważnym parametrem SMART. Oznacza on liczbę cykli uruchamiania i wyłączania dysku. Każde uruchomienie i wyłączenie sprzętu wpływa na jego żywotność i zużycie elementów wewnętrznych. Im wyższa liczba Start/Stop Count, tym więcej był eksploatowany dysk. Jest to ważny parametr, ponieważ zbyt duża ilość cykli może prowadzić do problemów z odczytem danych i przedwczesnej śmierci dysku. Dlatego ważne jest, aby śledzić wartość Start/Stop Count i stosować dobre praktyki związane z zarządzaniem energią oraz jak najczęściej wyłączać komputer w sposób poprawny.
  • Reallocated Sectors Count – liczba sektorów na dysku twardym, które zostały przeniesione do innej części dysku. Najczęściej, gdy dysk HDD napotka na błąd podczas odczytu/zapisu lub procedury weryfikacji danych, oznacza taki sektor jako ponownie przydzielony, a następnie przenosi dane do obszaru zarezerwowanego. Każdy dysk HDD posiada zapasowe sektory, które w razie problemów są wykorzystywane do zapobiegania uszkodzeniu danych zgromadzonych na dysku.
  • Power On Hours Count – to parametr, który informuje użytkownika o liczbie godzin, przez które dysk był uruchomiony. Oznacza to czas od momentu pierwszego uruchomienia dysku do chwili obecnej. Jest to bardzo ważny wskaźnik, który ujawnia, jak długo dysk pracował i jak długo może jeszcze działać przed awarią. Wartość Power On Hours Count jest mierzona w godzinach i zwykle widoczna jest w oprogramowaniu monitorującym dysk twardy. Warto regularnie monitorować czas pracy dysku i uwzględniać go w planowaniu jego wymiany, aby uniknąć ewentualnych awarii i utraty danych. Power On Hours Count może również wskazywać, czy dysk był używany w sposób poprawny w ciągu swojego cyklu życia, ponieważ nadmierna praca może skrócić jego żywotność.
  • Load Cycle Count – to jedna z wielu wartości znajdujących się w raporcie SMART dysku twardego. Reprezentuje ona liczbę razy, w których głowica odczytu/zapisu dysku została przemieszczona ze strefy parkowania (ang. Landing Zone). W przypadku dysków twardych, które są używane intensywnie, Load Cycle Count jest ważnym wskaźnikiem ich zużycia. Im wyższa wartość Load Cycle Count, tym większe prawdopodobieństwo awarii dysku. Każda zmiana pozycji wiąże się z mechanicznym działaniem elementów ruchomych wewnątrz dysku, co z czasem prowadzi do ich zużycia. Dla dysków HDD wartości wyznaczające granice żywotności mogą się różnić, przyjmuje się, że jest to od 200 do nawet 600 tysięcy. Dyski, które znajdowały zastosowanie w rozwiązaniach serwerowych mogły osiągać wartości nawet kilku milionów, co nie było niczym nadzwyczajnym i nie wynikało to z błędu SMART, czy też ze specyficznych odczytów dla modeli dysków znanego producenta (o czym możecie przeczytać na forach internetowych). Parametr Load Cycle Count należy stale monitorować w celu odpowiedniego planowania wymiany dysku.
  • Reallocated Event Count, w skrócie oznaczany jako REC – jest to parametr, który określa liczbę sektorów na dysku, które zostały przesunięte do obszaru zarezerwowanego. Jest to mechanizm, który pozwala dyskowi na dynamiczne przekierowywanie uszkodzonych sektorów na inne, wolne miejsca. REC wskazuje ile razy już wystąpiła taka sytuacja i ile sektorów zostało już przeniesionych do części rezerwowej dysku. Im wyższa wartość tego parametru, tym większe prawdopodobieństwo, że dysk może zawierać uszkodzone sektory i że jego zużycie jest zwiększone, co może prowadzić do awarii lub utraty danych. Jest to jeden z kluczowych parametrów, który warto monitorować, aby mieć świadomość stanu dysku i jego możliwego zużycia.
  • Current Pending Sector – oznacza ona liczbę sektorów na dysku, które nie mogą być używane do przechowywania danych, ponieważ nie działają prawidłowo. Sektory te zazwyczaj są niestabilne i mogą wkrótce ulec awarii. Na szczęście wartość Current Pending Sector jest monitorowana przez system SMART, co pozwala ostrzegać użytkownika o możliwej awarii dysku i podjąć odpowiednie kroki przed całkowitym uszkodzeniem urządzenia. Jeśli wartość Current Pending Sector wzrasta z czasem, warto rozważyć wymianę dysku, aby uniknąć utraty danych.
  • Write Error Rate – jest miarą liczby błędów pojawiających się podczas zapisu danych na dysku. Uściślając, informuje o liczbie błędów zapisu na dysku, które wystąpiły od momentu, kiedy dysk został uruchomiony po raz pierwszy. Zbyt wysoki wskaźnik Write Error Rate może oznaczać, że dysk ulega szybkiej degradacji i ma się niedługo zepsuć. Dlatego, gdy wskazanie osiągnie wartość powyżej 50, najlepiej będzie rozważyć wymianę dysku. Warto też dodać, że stale zwiększająca się wartość w krótkim odstępie czasu może być równie groźna, ponieważ wskazuje na stopniowe, ale nieuchronne pogorszenie stanu dysku.
  • Uncorrectable Sector Count, w skrócie USC – to kolejny parametr, który pozwala na monitorowanie stanu dysku twardego. Uncorrectable Sector Count informuje użytkownika o liczbie sektorów na dysku, które nie mogą być odczytane ze względu na uszkodzenia fizyczne lub logiczne. Im wyższa liczba USC, tym większe jest ryzyko poważnych problemów z dyskiem. W przypadku, gdy USC przekroczy pewien poziom, dysk twardy może przestać działać lub dojdzie do utraty wszystkich danych. Jeden z tych parametrów, który obowiązkowo należy monitorować.

UWAGA! W zależności od programu użytego do sprawdzenia parametrów SMART, nazewnictwo poszczególnych parametrów może się nieco różnić.

Opierając się na nazwach parametrów dostępnych w aplikacji CrystalDiskInfo, w przypadku dysków SSD należy uwzględnić:

  • Total Host Reads – wartość reprezentująca liczbę odczytu sektorów dysku w czasie jego eksploatacji. Oznacza to, ile razy dane zostały odczytane przez system lub przez aplikacje użytkownika. Wartość ta jest wykorzystywana do monitorowania zużycia dysku SSD w celu przewidywania jego awarii. Im wyższa wartość Total Host Reads, tym bardziej prawdopodobne jest wystąpienie potencjalnych problemów z dyskiem w niedalekiej przyszłości. Użycie S.M.A.R.T. dysku umożliwia użytkownikowi kontrolowanie wartości Total Host Reads oraz innych parametrów pracy dysku, co pozwala na skuteczne zarządzanie jego wydajnością i bezpieczeństwem danych.
  • Total Host Writes – to parametr, który określa łączną liczbę zapisów na dysku zarejestrowanych przez jego kontroler. Jest to ważny wskaźnik dla oceny trwałości nośnika, w szczególności dla dysków SSD, ponieważ każde zapisanie danych oznacza cykl zużywania komórek pamięci flash. W praktyce oznacza to, że im wyższa wartość Total Host Writes, tym większe prawdopodobieństwo, że dysk ulegnie awarii lub zużyje się szybciej. Jeden z kluczowych parametrów do oceny stanu dysków SSD, na który należy także zwracać uwagę przy zakupie używanego dysku SSD. W przypadku, gdy wartość ta przekracza zalecany próg, należy rozważyć wymianę dysku lub wprowadzić zmiany, które doprowadzą do zmniejszenia ilości zapisów na nim (można tego dokonać choćby poprzez przeniesienie katalogu TEMP i cache przeglądarek do RAMdysku, o czym wspominamy w tym artykule, oraz tutaj).
  • Power On Count.
  • Power On Hour.

Ostatnie 2 parametry w zestawieniu choć nazwy mają podobne, Power On Count oraz Power On Hour to dwa różne parametry S.M.A.R.T. dysku, które informują nas o czasie działania naszego urządzenia. Power On Count pokazuje liczbę uruchomień naszego dysku, natomiast Power On Hour mierzy ilość czasu pracy urządzenia wyrażoną w godzinach. Warto zauważyć, że Power On Hour może być wykorzystany jako wskaźnik jak często używamy dysku SSD. Oba parametry są ważne w monitorowaniu żywotności. W przypadku podejrzenia problemów z dyskiem, warto przyjrzeć się tym dwóm parametrom, aby zobaczyć, czy dysk wymaga wymiany.

Co to jest TBW w dyskach SSD i dlaczego jest ważne?

TBW (ang. Total Bytes Written) to miara ilości danych, jakie można zapisać na dysku SSD (Solid State Drive), przed osiągnięciem jego maksymalnej żywotności. Jest to bardzo istotne dla profesjonalistów, którzy często korzystają z intensywnych operacji zapisu i odczytu na dysku SSD. Dla dysków SSD TBW jest zazwyczaj wyrażany w terabajtach (TB) lub gigabajtach (GB), co zależy od modelu dysku. Przykładowo, dysk SSD o pojemności 1 TB i TBW 300 TB oznacza, że można na nim zapisać do 300 terabajtów danych.

Powszechnie panuje opinia, że większość użytkowników domowych nie powinna zwracać uwagi na TBW, ponieważ przeciętna osoba nie przeprowadza tak intensywnych operacji zapisu i odczytu na dyskach SSD. Jednak, gdy weźmiemy pod uwagę, że niektóre dyski oferują zaledwie 40 TBW, parametr ten będzie dla użytkownika bardzo istotny i wymagający ciągłego monitorowania.

Jak sprawdzić czas pracy dysku?

Jeżeli chcemy sprawdzić ile godzin przepracował nasz dysk oraz wydobyć inne parametry, z pomocą przyjdą nam aplikacje zewnętrzne. Jak wspomnieliśmy już wcześniej, jednym z takich programów jest CrystalDiskInfo, który można bezpłatnie pobrać ze strony producenta. Poniżej przedstawiamy przykładowy zrzut ekranu z informacjami o SMART dysku SSD.

parametry SMART w CrystalDiskInfo

Na powyższym przykładzie widzimy, że dysk SSD marki Samsung dotychczas przepracował 1484 godzin, dokonując w tym czasie 6734 GB zapisów, co stanowi 2,3 procenta jego możliwości, albowiem producent dla tego dysku ustalił TBW na poziomie 300 TB.

Jeśli chodzi o MTBF dla dysków HDD, są to wartości od kilkuset tysięcy do nawet kilku milionów. Dla przykładu, dla dysku IronWolf Pro 20TB jego producent firma Seagate ustaliła MTBF na 1,2 mln godzin. Z kolei bardziej przystępny cenowo dysk marki Toshiba, model L200 2TB – MTBF na poziomie 600 tyś. godzin.