Budowa dysku SSD — co jest w środku
Dyski SSD wyglądają różnie z zewnątrz — płaska karta M.2, klasyczny prostokąt 2.5", dysk zewnętrzny USB — ale w środku mają podobne elementy. Złożoność elektroniki bywa zaskakująca: niektóre dyski mają setki drobnych komponentów na PCB, osobne kości NAND, osobny chip DRAM jako bufor, rozbudowany kontroler. Inne — jak część dysków Toshiba czy Kioxia — to prawie "all in one", gdzie kontroler i pamięć są spakowane w jeden układ.
Trzy główne składniki każdego SSD:
1. Kontroler — "mózg" dysku. Obsługuje całą komunikację z komputerem, zarządza zapisem i odczytem danych, wykonuje wear leveling i garbage collection. Dla systemu operacyjnego dysk to tylko przestrzeń adresowa — kontroler robi wszystko żeby ta abstrakcja działała. Więcej o kontrolerach: Phison, Silicon Motion.
2. Pamięć NAND — tu leżą Twoje dane. Jeden lub więcej chipów flash na płytce. Jakość i typ tych kości ma ogromne znaczenie dla trwałości dysku — i jest jedną z głównych zmiennych które różnicują tanie od drogich dysków.
3. Bufor DRAM (opcjonalnie) — zewnętrzny chip pamięci RAM na płytce dysku, używany do cachowania tablicy FTL (więcej o tym za chwilę). Dyski bez DRAM (DRAM-less) używają HMB (Host Memory Buffer) — pożyczają kawałek RAM komputera — albo nie mają cache w ogóle. Wpływa na wydajność i nieco na niezawodność.
Interfejsy — jak SSD łączy się z komputerem
Zanim przejdziemy do tego jak dane są przechowywane — warto wiedzieć przez co dysk "rozmawia" z komputerem. To ważne bo awaria elektroniki interfejsu to osobna kategoria problemów od awarii NAND.
Pamięć NAND — gdzie leżą Twoje dane
NAND flash to technologia przechowywania danych w komórkach które trzymają ładunek elektryczny. Brak ładunku = 0, ładunek = 1. Prosto. Problem zaczyna się gdy chcemy zmieścić więcej danych na tym samym chipie — i tu wchodzi podział na typy NAND.
Im więcej bitów na komórkę, tym taniej i gęściej — ale za cenę trwałości i szybkości. To podstawowy trade-off.
Większość dysków consumer to dziś TLC. QLC pojawia się w budżetówce i pojemnościowych dyskach gdzie priorytetem jest cena za terabajt, nie trwałość. Tanie dyski no-name z AliExpress często mają QLC — i to jest jeden z powodów dla których bywają zawodne.
P/E cycle (Program/Erase cycle) to ile razy komórkę można zapisać i skasować zanim stanie się zawodna. TBW (Total Bytes Written) które podają producenci to przeliczenie P/E cycles na realne dane — przy założeniu określonego write amplification factor.
FTL — mapa która rządzi wszystkim
To jest centralny punkt budowy SSD z perspektywy odzysku danych — i dlatego poświęcę mu trochę więcej miejsca.
Pamięć NAND ma jedno zasadnicze ograniczenie: nie można nadpisać danych bezpośrednio. Żeby zapisać nowe dane w miejscu gdzie były stare, cały blok (duża jednostka pamięci — setki stron) musi być najpierw skasowany. To nieefektywne i szkodliwe dla trwałości kości.
Rozwiązaniem jest FTL — Flash Translation Layer. To warstwa firmware w kontrolerze która tłumaczy adresy logiczne (LBA — to co widzi system operacyjny) na fizyczne lokalizacje w NAND (PBA). Kiedy piszesz plik, FTL nie nadpisuje starych danych w tym samym miejscu — zapisuje nową wersję w wolnym miejscu i aktualizuje tablicę mapowań. Stare dane siedzą sobie w NAND dopóki garbage collection ich nie posprząta.
FTL robi też więcej: zarządza wear leveling (równomierne rozłożenie zapisów na wszystkie komórki żeby żadna nie zużyła się szybciej), garbage collection (sprzątanie nieaktualnych danych), bad block management (omijanie zużytych lub wadliwych bloków) i over-provisioning (rezerwowa przestrzeń niedostępna dla użytkownika, używana jako zapasowe bloki).
Kiedy ktoś mówi że jego dysk "padł i danych nie ma" — w większości przypadków dane fizycznie są na kościach NAND. Problem leży w FTL. Albo mapa jest uszkodzona, albo kontroler nie może jej załadować, albo firmware jest w złym stanie i cały dysk jest zablokowany. To jest sedno pracy w laboratorium — dostać się do danych mimo że "normalna droga" przez FTL jest zamknięta.Gdzie SSD najczęściej zawodzi — trzy główne kategorie
Z mojego doświadczenia w laboratorium zdecydowana większość przypadków to jedno z trzech: degradacja NAND, błędy firmware/FTL, lub uszkodzenia elektroniczne. Rzadko cokolwiek innego.
Różnica między dyskami jest ogromna. Jeden dysk TLC z dobrymi kościami przeżyje TBW podane przez producenta i więcej. Inny — tańszy, z gorszymi kośćmi lub złym doborem komponentów — padnie znacznie wcześniej. Zdarza się że dyski padają w ułamku zadeklarowanego TBW.
Firmware odgrywa tu rolę: kontrolery z agresywnym maskowaniem błędów (niektóre implementacje Silicon Motion) mogą ukrywać degradację NAND przez długi czas — dysk nagle pada bez ostrzeżenia gdy jest już w bardzo złym stanie.
Efekty: dysk wyświetla się jako SATAFIRM S11 zamiast swojej nazwy, pojemność 0 MB lub 8 MB, dysk niewidoczny po aktualizacji BIOS, dysk znika po nagłym braku zasilania. Dane fizycznie są na NAND — problem jest w uszkodzonej mapie FTL lub niedostępnym firmware.
Tu praca zaczyna się od elektroniki — naprawa lub wymiana komponentów zanim w ogóle spróbujemy podejść do danych. Mikrosoldering, wymiana PMIC, naprawa ścieżek. Dopiero sprawna elektronika otwiera drogę do danych przez PC-3000.
TBW — ile można zapisać na dysku SSD
TBW (Total Bytes Written) to gwarancja producenta na ile danych można zapisać na dysku zanim straci gwarancję. Na przykład Samsung 870 EVO 500 GB ma TBW = 300 TB — producent gwarantuje sprawne działanie przez co najmniej 300 terabajtów zapisów.
W praktyce większość dysków konsumenckich nie osiąga swojego TBW przez zwykłe użytkowanie. Przeciętny użytkownik zapisuje kilkadziesiąt GB miesięcznie — żeby zużyć 300 TB TBW musiałby zapisywać ~50 GB dziennie przez 16 lat. Dyski padają zazwyczaj z innych przyczyn.
Ale TBW ma znaczenie w dwóch przypadkach: intensywne użytkowanie (serwery, stacje robocze z dużym write amplification) i tanie dyski z zaniżonym TBW — niektóre budżetowe dyski mają TBW 40–80 TB przy pojemności 500 GB, co przy codziennym użytkowaniu może skończyć się w kilka lat.
Co z tego wynika praktycznie
Kilka wniosków które wynikają z tego jak działają dyski SSD:
Kopie zapasowe są ważniejsze niż przy HDD — SSD potrafią paść bez ostrzeżenia, szczególnie te z agresywnym maskowaniem błędów. HDD zazwyczaj sygnalizuje problemy wcześniej (spowolnienie, odgłosy). SSD często nie.
Tani dysk to nie tylko gorsza prędkość — gorsze kości NAND, brak DRAM bufora, uproszczony firmware z gorszym wear levelingiem. Jeśli trzymasz ważne dane, różnica między dyskiem za 100 zł a za 250 zł to nie tylko benchmarki.
Gdy SSD zaczyna wykazywać problemy — działaj szybko — nie czekaj aż "samo przejdzie". Niestabilność dysku to okno czasowe, nie permanentny stan. Każde uruchomienie uszkodzonego dysku może przyspieszyć całkowitą awarię.
Dane fizycznie są — nawet gdy dysk "padł" — w zdecydowanej większości przypadków awarii SSD dane są nienaruszone na kościach NAND. Problem leży w dostępie do nich. To jest powód dla którego odzysk z SSD jest często możliwy nawet gdy dysk jest kompletnie niewidoczny.
Twój SSD ma problem?
Opisz mi co się stało.
Bezpłatna wycena online — odpiszę tego samego dnia z wstępną oceną. Diagnoza w laboratorium 1–3 dni robocze od otrzymania nośnika.