Testowanie sprzętu

Testowanie sprzętu

Ważną sprawą, o której powinniśmy pamiętać przed przystąpieniem do wykonywania pierwszych testów jest sprawdzenie sprzętu - musimy mieć pewność, że działa poprawnie. Na dobrą sprawę powinno wystarczyć jednorazowe, porządne przetestowanie wszystkich komponentów naszego komputera. W późniejszym czasie, gdy pojawią się jakieś wątpliwości np. co do działania dysku twardego, możemy go sprawdzić ponownie (dyski twarde czasami się sypią).

Do wykonania testów pamięci może nam posłużyć program Memtest86+. Zalecam pobranie obrazu iso ze strony projektu http://www.memtest.org/ i uruchomienie programu z płyty cd. Można się też posłużyć starszym programem Memtest86 http://www.memtest86.com/ , lub jakimkolwiek innym, dobrze spełniającym powyższe zadanie.

Skanowanie powierzchni dysku w poszukiwaniu obszarów uszkodzonych możemy przeprowadzić przy pomocy standardowego „badblocks”. Wpisanie
# /sbin/badblocks -v /dev/dysk
powinno w miarę szybko dać nam odpowiedź, czy nasz dysk jest tak sprawny jakbyśmy tego chcieli. Dodatkowe informacje o stanie dysku można uzyskać wykonując test przy pomocy mechanizmu S.M.A.R.T.
# smartctl —test=long /dev/dysk
Rezultat testu możemy zobaczyć wydając polecenie
# smartctl -a /dev/dysk
Jeżeli podkręcamy procesor, pamięć etc. to na czas wykonywania testów musimy z tego zrezygnować. Podkręcanie sprzętu może wprowadzić przekłamania, oraz wywołać różne losowe błędy.

Warto sprawdzić czy napięcia zasilające podzespoły naszego komputera są prawidłowe, tutaj program lm_sensors przyjdzie nam z pomocą. Możemy też użyć programu dostarczonego przez producenta płyty głównej (niestety przeważnie wersja tylko dla Windows), często umożliwiającego wykonanie dodatkowej diagnostyki.

Dodatkowo powinniśmy pamiętać o występowaniu różnych losowych błędów związanych ze sprzętem, a niekoniecznie będących jego winą - np. wynikłych z promieniowania elektromagnetycznego, kosmicznego. Nie da się zabezpieczyć na 100% przed takimi błędami, jednak producenci sprzętu stosują różne technologie np. pamięć RAM z ECC, sprawdzanie sum kontrolnych przesyłanych bajtów na magistralach etc. mające za zadanie ograniczyć występowanie problemów związanych z przekłamaniami danych.

Kolejną kategorią błędów sprzętowych są wyjątki MCE (Machine Check Exception) generowane przez procesor, który powiadamia w ten sposób system np. o problemie z wewnętrzną pamięcią cache, niedopuszczalnym przegrzaniu etc. Po wykryciu takiego błędu system uznaje się za „skażony” i dodaje literkę „M” do linijki zawierającej informacje o EIP w oops’ie (EIP: 0060:[<c046c7c3>] Tainted: PM VLI).

Przy pomocy Linux-ready Firmware Developer Kit http://www.linuxfirmwarekit.org/ możemy sprawdzić czy BIOS naszego komputera nie zawiera poważnych błędów. Wprawdzie nie będziemy mogli na to zbyt wiele poradzić - poza zaktualizowaniem do najnowszej wersji i ewentualnym powiadomieniem producenta sprzętu, jednak będziemy mieć świadomość występowania usterek. To może nam później pomóc w stwierdzeniu, czy znaleziony problem leży po stronie sprzętu, czy systemu operacyjnego.

O ile nie zaznaczono inaczej, treść tej strony objęta jest licencją Creative Commons Attribution-Share Alike 2.5 License.