Kiedy odbudowanie macierzy RAID-5 jest OK, a kiedy nie bardzo?

Data:

Tag: Baza wiedzy

Autor: Patryk Mikołap

W branży odzyskiwania danych słyszymy to cały czas:

„Brakowało wolumenu danych, więc wykonałem odbudowę”.

„Partycja nie chciała się zamontować, więc kliknąłem Rebuild RAID”.

„Wszystkie moje dane były uszkodzone, więc wykonałem …”.

Te cytaty pokazują, jak niewiele osób rozumie, czym jest odbudowa macierzy RAID i do czego służy.

Kontroler RAID nie ma pojęcia, jak wyglądają twoje partycje, nie dba o twoje zdjęcia, bazy danych czy projekty.
Niezależnie czy jest to sprzętowy, czy programowy RAID.

Kontroler nie ma pojęcia, czy twoje dane są uszkodzone, czy nie. 

RAID ma jedno zadanie: weź kilka dysków i zrób z nich jeden logiczny wolumin danych. 
Nie patrzy na te dane, nie sprawdza tych danych ani nie rozumie ich zawartości, ani nie chce tego robić.

Gdy RAID jest nadmiarowy (jak RAID-5, RAID-6 lub RAID-1), podstawową filozofią jest to, że kontroler RAID będzie wykorzystywał pewien procent każdego pojedynczego dysku, aby zapewnić tę nadmiarowość.

Jest tylko jeden scenariusz, w którym sensowne jest przebudowanie macierzy RAID:

Stan logiczny woluminy z danymi jest dobry. Montuje się wolumin, system uruchamia się świetnie, żadne dane nie są uszkodzone – ale jeden fizyczny dysk należący do macierzy RAID nie jest zsynchronizowany lub jest nowym dyskiem.

Jeśli stan logiczny jest zły, odbudowa RAID jest niezwykle niebezpieczna.

Jako specjaliści ds. odzyskiwania danych często widzimy błąd, w którym administrator IT zauważył 2 uszkodzone dyski w macierzy RAID-5. 

Wybierają jeden losowo i wymuszają go online. Teraz wolumin uruchamia się, ale brakuje wielu ostatnich danych lub jest uszkodzonych. Dzieje się tak, ponieważ dysk, którego właśnie zmusili do pracy, zawiódł 4 lata temu i nikt nie zauważył uszkodzonego dysku… Tak więc system operacyjny może się uruchomić, ponieważ nie został przeniesiony ani nie zmienił się znacząco od 4 lat, ale wszystkie dane, które zostały utworzone lub zaktualizowane w tym okresie, jest ich brak lub są uszkodzone.

katastrofa przy odbudowie RAID

Teraz obsługa uszkodzonej macierzy podwaja swój błąd i postanawia przeprowadzić odbudowę macierz RAID — Rebuild RAID. 

Odbudowa RAID osiąga w tym scenariuszu, że bierze bieżący stan logiczny macierzy dyskowej, który jest znowu bardzo zły, a następnie sprawia, że ​​złe dane są nadmiarowe, obliczając i zapisując informacje parzystości na innym dysku członkowskim z macierzy, który był w trybie offline. Ten element członkowski to ten, który wczoraj zawiódł i zawierał dane wymagane do uzyskania zdrowego wolumenu. 

Odbudowa RAID w tym przypadku usuwa wszystkie ostatnie pliki, dokumenty w dość trwały sposób.

Teraz kontroler RAID jest zadowolony, hura! RAID odbudowany! Ale stan logiczny jest przerażający, ponieważ masz teraz być może 2 dobre dyski ze złą parzystością, dysk, który wyłączył się 4 lata temu i uszkodzony dysk, który zawiera mnóstwo przebudowanych śmieci i zniszczonych XOR. Ale kontroler RAID jest całkiem zadowolony, że wszystko jest idealnie zsynchronizowane i nadmiarowe…

Wyjaśnienie dla mniej technicznych osób, w takim przypadku prawdopodobnie dane trwale przepadły.

Morał z tej historii: bądź niezwykle ostrożny podczas audytu kopii zapasowych, zanim zaczniesz kombinować z kontrolerem RAID. 

Wykonaj kopie zapasowe danych na RÓŻNY zestaw dysków i upewnij się, że kopie zapasowe są kompletne i aktualne. Po ustaleniu, że kopie zapasowe są OK i przede wszystkim kompletne, przejdź do pracy i przywróć fizyczną macierz do trybu online.

Potrzebujesz pomocy teraz?

Możemy pomóc w problemach z odbudową macierzy RAID

Porozmawiaj z ekspertem od macierzy RAID i odzyskaniu danych. Uzyskaj konsultację teraz!

Jak odbudować RAID 5 bez utraty danych?

W idealnym przypadku administrator IT zostanie powiadomiony o stanie awaryjnym z oprogramowania monitorującego, lub z kontrolera RAID. Jak wspomniano wcześniej, stan logiczny macierzy powinien być dobry przed próbą odbudowy — to znaczy, że macierz RAID może mieć stan zdegradowany, ale powinien być normalny dostęp do danych z zachowaną funkcjonalnością macierzy.

Po raz kolejny, jeśli dane są niedostępne lub wolumin nie jest w trybie online, odbudowa nigdy nie pomoże.

W rzeczywistości będzie to potencjalnie katastrofalne. 

Po upewnieniu się, że wszystko z punktu widzenia użytkownika końcowego jest świetne, informatyk musi wyciągnąć i wymienić uszkodzony dysk. Teraz powinna się odbyć odbudowa nadmiarowości w macierzy RAID. Niektóre kontrolery RAID zostaną skonfigurowane do automatycznego odbudowywania po wykryciu nowego, sprawnego dysku. Niektóre będą wymagać uruchomienia poleceń na karcie RAID, czasami za pośrednictwem GUI. Kontroler RAID odczyta wszystkie informacje z bieżących dysków i przeprowadzi obliczenia parzystości XOR, zapisując wyniki na nowym, sprawnym dysku. Czas trwania takiego procesu trwa od kilku godzin do dni. Wszystko w zależności od ilości i pojemności dysków. Pod koniec tego procesu macierz nie jest już zdegradowana i wrócisz do prawidłowego stanu — Macierz będzie odporna na awarie, tak długo, aż kolejny dysk nie zostanie wyłączony na skutek degradacji.

Czy można odzyskać dane z macierzy RAID5 tylko z jednego dysku?

Nie jest możliwe odzyskanie danych, mając tylko jeden dysk z RAID 5. Dzieje się tak, ponieważ najważniejsze pliki będą znacznie większe niż rozmiar paska tablicy.

Czteromegabajtowy obraz zostanie podzielony na setki 64-kilobajtowych fragmentów w odpowiedniej kolejności, a w 4-dyskowym RAID 5 każdy dysk będzie zawierał 25% tych fragmentów. Musimy przeanalizować i skopiować każdy dysk, aby określić ogólną geometrię tablicy i określić, który zestaw dysków jest optymalny. Aby odzyskiwanie danych było możliwe, musimy mieć wszystkie elementy układanki.

Jeśli RAID-5 jest tak świetny, to dlaczego Serwis Otako widzi ich tak wiele w swoim laboratorium?

RAID 5 oferuje nadmiarowe przechowywanie danych na jednym dysku, co pozwala na niewielkie zmniejszenie całkowitej ilości pamięci masowej. Macierze RAID 5 będą wymagały co najmniej trzech dysków, ale zwykle będą składać się z maksymalnie 8. Główną ideą jest to, że jeśli jeden dysk ulegnie awarii, kontroler RAID usunie go z grupy, ale nie ma to bezpośredniego wpływu na informacje i działanie twojej firmy. W tym zdegradowanym stanie nadal możesz uruchamiać, uzyskiwać dostęp do danych i zapisywać nowe. Wygląda na to, że dobrze utrzymana macierz RAID 5 nigdy nie powinna ulec awarii… Ale nawet dobrze wyglądające macierze RAID mogą wymagać wizyty w laboratorium odzyskiwania danych. Oto kilka powodów, dla których:

1. RAID 5 nie jest logiczną kopią zapasową.

Nawet przy nadmiarowości zapewnianej przez RAID 5, nie ma nigdzie kopii danych. Chyba że skrupulatnie wykonasz kopię zapasową danych za pomocą usługi tworzenia kopii zapasowych danych dostępnych w rozwiązaniach od macierzy. Jeśli człowiek popełni błąd i usunie mnóstwo danych, RAID 5 nie może ci pomóc. Jeśli złośliwy człowiek lub proces zainfekuje zawartość RAID 5  wirusem ransomware, RAID 5 nie może ci pomóc. 

Jeśli nie widzisz różnicy między RAID a kopią zapasową, możesz sparzyć się z powodu wszelkiego rodzaju problemów z danymi i w końcu zadzwonić do profesjonalnego laboratorium takim jak nasze.

2. W przypadku awarii dwóch dysków w RAID5

Awaria wielu dysków jest najczęstszą przyczyną konieczności szukania pomocy u profesjonalistów. Jesteśmy często wzywani do odzyskania danych z konfiguracji RAID 5 z 2 uszkodzonymi dyskami. Czasami co najmniej dwa dyski ulegną awarii jednocześnie z powodu nagłej utraty zasilania lub skoku napięcia. Częściej jeden z dysków zawodził w przeszłości i uważamy jego dane za przestarzałe. W zależności od tego, jak długo dysk był nieaktualny, będzie miał ograniczoną użyteczność w wysiłku odzyskiwania danych RAID 5.

Przy założeniu, że awarii uległy 2 dyski z macierzy RAID 5 złożonej z czterech dysków, parzystości XOR nie można w pełni obliczyć i pozostaje 50% lub mniej danych binarnych wolumenu RAID 5.

Zawartość binarna woluminu jest rozłożona na dyskach, a rozmiar paska (stripe) jest zwykle mierzony w kilobajtach (64, 128 KB). Tak więc nie masz dostępu do 50% swoich plików, masz dostęp tylko do 50% binarnych każdego pliku.

Co gorsza, będziesz mieć dostęp tylko do 50% definicji plików. I to tylko wtedy, gdy możesz nawet sprawić, by kontroler RAID obsłużył ten częściowy RAID — co jest okropnym pomysłem, ponieważ kontrolery spójności systemu plików będą niszczyć dane, które wydają się być uszkodzone, ale są po prostu niekompletne.

Chcesz odzyskać swoje dane RAID? Skontaktuj się z nami już dziś!

Potrzebujesz pomocy teraz?

Możemy pomóc w problemach z odbudową macierzy RAID

Porozmawiaj z ekspertem, przywrócimy utracone dane.

Dodaj komentarz