Budowa dysku SSD — co jest w środku

Dyski SSD wyglądają różnie z zewnątrz — płaska karta M.2, klasyczny prostokąt 2.5", dysk zewnętrzny USB — ale w środku mają podobne elementy. Złożoność elektroniki bywa zaskakująca: niektóre dyski mają setki drobnych komponentów na PCB, osobne kości NAND, osobny chip DRAM jako bufor, rozbudowany kontroler. Inne — jak część dysków Toshiba czy Kioxia — to prawie "all in one", gdzie kontroler i pamięć są spakowane w jeden układ.

Trzy główne składniki każdego SSD:

1. Kontroler — "mózg" dysku. Obsługuje całą komunikację z komputerem, zarządza zapisem i odczytem danych, wykonuje wear leveling i garbage collection. Dla systemu operacyjnego dysk to tylko przestrzeń adresowa — kontroler robi wszystko żeby ta abstrakcja działała. Więcej o kontrolerach: Phison, Silicon Motion.

2. Pamięć NAND — tu leżą Twoje dane. Jeden lub więcej chipów flash na płytce. Jakość i typ tych kości ma ogromne znaczenie dla trwałości dysku — i jest jedną z głównych zmiennych które różnicują tanie od drogich dysków.

3. Bufor DRAM (opcjonalnie) — zewnętrzny chip pamięci RAM na płytce dysku, używany do cachowania tablicy FTL (więcej o tym za chwilę). Dyski bez DRAM (DRAM-less) używają HMB (Host Memory Buffer) — pożyczają kawałek RAM komputera — albo nie mają cache w ogóle. Wpływa na wydajność i nieco na niezawodność.

Interfejsy — jak SSD łączy się z komputerem

Zanim przejdziemy do tego jak dane są przechowywane — warto wiedzieć przez co dysk "rozmawia" z komputerem. To ważne bo awaria elektroniki interfejsu to osobna kategoria problemów od awarii NAND.

SATA III

Klasyczny interfejs 2.5" i M.2 SATA. Najstarszy z używanych dziś standardów, ograniczony przepustowością.

max ~550 MB/s

NVMe PCIe 3.0

M.2 NVMe — znacznie szybszy niż SATA. Standard przez kilka lat, wciąż popularny w laptopach i PC.

max ~3 500 MB/s

NVMe PCIe 4.0

Aktualny mainstream w nowszych komputerach. Dwa razy szybszy niż PCIe 3.0.

max ~7 000 MB/s

USB (mostek)

Dyski zewnętrzne USB — wewnątrz jest normalny SSD SATA lub NVMe, podłączony przez układ mostka USB.

USB 3.x ~500–1000 MB/s

M.2 (złącze)

Złącze fizyczne — może przenosić zarówno SATA jak i NVMe. Typ protokołu zależy od dysku i płyty głównej.

Zależy od protokołu

PCIe (karta)

Dyski SSD w formie karty PCIe — spotykane w stacjach roboczych i starszych MacBookach Pro.

Zależy od wersji PCIe

Pamięć NAND — gdzie leżą Twoje dane

NAND flash to technologia przechowywania danych w komórkach które trzymają ładunek elektryczny. Brak ładunku = 0, ładunek = 1. Prosto. Problem zaczyna się gdy chcemy zmieścić więcej danych na tym samym chipie — i tu wchodzi podział na typy NAND.

Im więcej bitów na komórkę, tym taniej i gęściej — ale za cenę trwałości i szybkości. To podstawowy trade-off.

SLC

Single Level Cell

Bity / komórkę: 1

P/E cycles: ~100 000

Trwałość: Najlepsza

Gdzie: Enterprise, industrial

MLC

Multi Level Cell

Bity / komórkę: 2

P/E cycles: ~3 000–10 000

Trwałość: Dobra

Gdzie: Profesjonalne, prosumer

TLC

Triple Level Cell

Bity / komórkę: 3

P/E cycles: ~1 000–3 000

Trwałość: Przeciętna

Gdzie: Mainstream consumer

QLC

Quad Level Cell

Bity / komórkę: 4

P/E cycles: ~100–1 000

Trwałość: Niska

Gdzie: Budżetowe, pojemnościowe

Większość dysków consumer to dziś TLC. QLC pojawia się w budżetówce i pojemnościowych dyskach gdzie priorytetem jest cena za terabajt, nie trwałość. Tanie dyski no-name z AliExpress często mają QLC — i to jest jeden z powodów dla których bywają zawodne.

P/E cycle (Program/Erase cycle) to ile razy komórkę można zapisać i skasować zanim stanie się zawodna. TBW (Total Bytes Written) które podają producenci to przeliczenie P/E cycles na realne dane — przy założeniu określonego write amplification factor.

FTL — mapa która rządzi wszystkim

To jest centralny punkt budowy SSD z perspektywy odzysku danych — i dlatego poświęcę mu trochę więcej miejsca.

Pamięć NAND ma jedno zasadnicze ograniczenie: nie można nadpisać danych bezpośrednio. Żeby zapisać nowe dane w miejscu gdzie były stare, cały blok (duża jednostka pamięci — setki stron) musi być najpierw skasowany. To nieefektywne i szkodliwe dla trwałości kości.

Rozwiązaniem jest FTL — Flash Translation Layer. To warstwa firmware w kontrolerze która tłumaczy adresy logiczne (LBA — to co widzi system operacyjny) na fizyczne lokalizacje w NAND (PBA). Kiedy piszesz plik, FTL nie nadpisuje starych danych w tym samym miejscu — zapisuje nową wersję w wolnym miejscu i aktualizuje tablicę mapowań. Stare dane siedzą sobie w NAND dopóki garbage collection ich nie posprząta.

Dlaczego FTL jest tak ważny Cały Twój dysk — z perspektywy systemu — to tylko ciąg adresów logicznych LBA 0 do LBA N. FTL utrzymuje mapę która mówi gdzie każdy z tych adresów faktycznie leży fizycznie w NAND. Gdy FTL pada lub ulega uszkodzeniu — dysk znika. Dane fizycznie nadal są na kościach. Ale bez mapy system nie wie gdzie ich szukać.

FTL robi też więcej: zarządza wear leveling (równomierne rozłożenie zapisów na wszystkie komórki żeby żadna nie zużyła się szybciej), garbage collection (sprzątanie nieaktualnych danych), bad block management (omijanie zużytych lub wadliwych bloków) i over-provisioning (rezerwowa przestrzeń niedostępna dla użytkownika, używana jako zapasowe bloki).

Kiedy ktoś mówi że jego dysk "padł i danych nie ma" — w większości przypadków dane fizycznie są na kościach NAND. Problem leży w FTL. Albo mapa jest uszkodzona, albo kontroler nie może jej załadować, albo firmware jest w złym stanie i cały dysk jest zablokowany. To jest sedno pracy w laboratorium — dostać się do danych mimo że "normalna droga" przez FTL jest zamknięta.

Gdzie SSD najczęściej zawodzi — trzy główne kategorie

Z mojego doświadczenia w laboratorium zdecydowana większość przypadków to jedno z trzech: degradacja NAND, błędy firmware/FTL, lub uszkodzenia elektroniczne. Rzadko cokolwiek innego.

~90% przypadków · Najczęstsze

Degradacja pamięci NAND — normalne zużycie

Komórki NAND mają ograniczoną liczbę cykli zapisu. Gdy zbyt wiele komórek się zużyje — ECC nie wyrabia z korekcją błędów, bad block management wyczerpuje pulę zapasowych bloków, dysk traci stabilność lub pada. To naturalna śmierć dysku.

Różnica między dyskami jest ogromna. Jeden dysk TLC z dobrymi kościami przeżyje TBW podane przez producenta i więcej. Inny — tańszy, z gorszymi kośćmi lub złym doborem komponentów — padnie znacznie wcześniej. Zdarza się że dyski padają w ułamku zadeklarowanego TBW.

Firmware odgrywa tu rolę: kontrolery z agresywnym maskowaniem błędów (niektóre implementacje Silicon Motion) mogą ukrywać degradację NAND przez długi czas — dysk nagle pada bez ostrzeżenia gdy jest już w bardzo złym stanie.

Niestabilny dysk — objawy i co robić →

Częste · Różne objawy

Błędy firmware i FTL — kontroler żyje, mapa pada

Firmware dysku to oprogramowanie przechowywane w specjalnym obszarze serwisowym NAND. Jeśli ten obszar ulegnie uszkodzeniu — przez nagłe odcięcie zasilania podczas zapisu, błąd w samym firmware (niektóre wczesne wersje Phison PS3111, Samsung z trybem "errormod"), lub zwykłe zużycie komórek serwisowych — dysk nie może się poprawnie uruchomić.

Efekty: dysk wyświetla się jako SATAFIRM S11 zamiast swojej nazwy, pojemność 0 MB lub 8 MB, dysk niewidoczny po aktualizacji BIOS, dysk znika po nagłym braku zasilania. Dane fizycznie są na NAND — problem jest w uszkodzonej mapie FTL lub niedostępnym firmware.

SATAFIRM S11 — co to i jak odzyskać →

Rzadziej · Różne przyczyny

Uszkodzenia elektroniczne — zwarcia, przepięcia, uszkodzenia PCB

Przepięcie spali PMIC (power management IC) lub inne komponenty na płytce. Zalanie uszkadza laminat i ścieżki. Zły kontakt w złączu M.2. Wadliwy egzemplarz z fabryki. Fizyczne uszkodzenie przez upadek lub zgniecenie.

Tu praca zaczyna się od elektroniki — naprawa lub wymiana komponentów zanim w ogóle spróbujemy podejść do danych. Mikrosoldering, wymiana PMIC, naprawa ścieżek. Dopiero sprawna elektronika otwiera drogę do danych przez PC-3000.

SSD po przepięciu — odzysk danych →

TBW — ile można zapisać na dysku SSD

TBW (Total Bytes Written) to gwarancja producenta na ile danych można zapisać na dysku zanim straci gwarancję. Na przykład Samsung 870 EVO 500 GB ma TBW = 300 TB — producent gwarantuje sprawne działanie przez co najmniej 300 terabajtów zapisów.

W praktyce większość dysków konsumenckich nie osiąga swojego TBW przez zwykłe użytkowanie. Przeciętny użytkownik zapisuje kilkadziesiąt GB miesięcznie — żeby zużyć 300 TB TBW musiałby zapisywać ~50 GB dziennie przez 16 lat. Dyski padają zazwyczaj z innych przyczyn.

Ale TBW ma znaczenie w dwóch przypadkach: intensywne użytkowanie (serwery, stacje robocze z dużym write amplification) i tanie dyski z zaniżonym TBW — niektóre budżetowe dyski mają TBW 40–80 TB przy pojemności 500 GB, co przy codziennym użytkowaniu może skończyć się w kilka lat.

SMART i monitorowanie zużycia CrystalDiskInfo (Windows) pokazuje wartość "Percent Used" lub "Wear Level" z SMART dysku. Producenci różnie to oznaczają — Samsung używa atrybutu 177, inne marki 173 lub podobnych. Wartość 0% = nowy, 100% = TBW wyczerpany według deklaracji producenta. To nie znaczy że dysk padnie przy 100% — ale to sygnał do wykonania kopii zapasowej.

Co z tego wynika praktycznie

Kilka wniosków które wynikają z tego jak działają dyski SSD:

Kopie zapasowe są ważniejsze niż przy HDD — SSD potrafią paść bez ostrzeżenia, szczególnie te z agresywnym maskowaniem błędów. HDD zazwyczaj sygnalizuje problemy wcześniej (spowolnienie, odgłosy). SSD często nie.

Tani dysk to nie tylko gorsza prędkość — gorsze kości NAND, brak DRAM bufora, uproszczony firmware z gorszym wear levelingiem. Jeśli trzymasz ważne dane, różnica między dyskiem za 100 zł a za 250 zł to nie tylko benchmarki.

Gdy SSD zaczyna wykazywać problemy — działaj szybko — nie czekaj aż "samo przejdzie". Niestabilność dysku to okno czasowe, nie permanentny stan. Każde uruchomienie uszkodzonego dysku może przyspieszyć całkowitą awarię.

Dane fizycznie są — nawet gdy dysk "padł" — w zdecydowanej większości przypadków awarii SSD dane są nienaruszone na kościach NAND. Problem leży w dostępie do nich. To jest powód dla którego odzysk z SSD jest często możliwy nawet gdy dysk jest kompletnie niewidoczny.

Twój SSD ma problem?
Opisz mi co się stało.

Bezpłatna wycena online — odpiszę tego samego dnia z wstępną oceną. Diagnoza w laboratorium 1–3 dni robocze od otrzymania nośnika.

Wyślij dysk na diagnozę → Bezpłatna wycena online

Jak działa dysk SSD —i gdzie najczęściej zawodzi