PDA

Показать полную графическую версию : Проверить состояние HDD на физическом сервере Debian


jonikster
17-02-2021, 07:46
Здравствуйте.
Есть физический сервер на Debian. Хочу проверить состояние дисков. Как это можно осуществить?
iostat выдает:
Linux 4.19.0-13-amd64 (ryzhikov) 02/16/2021 _x86_64_(8 CPU)

avg-cpu: %user %nice %system %iowait %steal %idle
0.04 0.00 0.03 0.03 0.00 99.90

Device r/s w/s rkB/s wkB/s rrqm/s wrqm/s %rrqm %wrqm r_await w_await aqu-sz rareq-sz wareq-sz svctm %util
sdb 0.09 1.19 3.15 9.70 0.00 0.60 0.86 33.71 8.97 6.43 0.01 33.77 8.16 3.48 0.45
sda 0.23 1.34 29.26 9.70 0.00 0.60 0.30 31.10 7.40 4.94 0.00 129.52 7.25 0.68 0.11
md1 0.00 0.00 0.07 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 21.39 0.00 0.00 0.00
md2 0.29 1.11 8.60 9.11 0.00 0.00 0.00 0.00 0.00 0.00 0.00 29.63 8.19 0.00 0.00

Попробовал badblocks, он начал работу, а потом ssh вылетел.
Если iostat недостаточно, что можно попробовать?
Заранее благодарен!

NickM
17-02-2021, 09:58
Хочу проверить состояние дисков. Как это можно осуществить? »

smartctl (https://www.smartmontools.org/)?

Jula0071
17-02-2021, 13:43
sudo apt update && sudo apt install smartmontools
sudo smartctl -a /dev/sda
sudo smartctl -a /dev/sdb

Выхлоп интерпертируйте сами (там обычный отчёт смарта) либо сюда.

PS от обрывов соединения помогает screen.

jonikster
18-02-2021, 00:28
Jula0071,
smartctl -a /dev/sda
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-13-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Vendor: FUJITSU
Product: MBA3147RC
Revision: 0103
User Capacity: 147,086,327,808 bytes [147 GB]
Logical block size: 512 bytes
Rotation Rate: 15000 rpm
Logical Unit id: 0x500000e01b717ab0
Serial number: BJA0P8502D8M
Device type: disk
Transport protocol: SAS (SPL-3)
Local Time is: Wed Feb 17 16:25:48 2021 EST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Temperature Warning: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK

Current Drive Temperature: 29 C
Drive Trip Temperature: 65 C

Manufactured in week 21 of year 2008
Specified cycle count over device lifetime: 50000
Accumulated start-stop cycles: 32
Elements in grown defect list: 0

Error counter log:
Errors Corrected by Total Correction Gigabytes Total
ECC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 0 3064 0 0 0 724489.125 0
write: 0 0 0 0 0 297713.824 0

Non-medium error count: 27

No self-tests have been logged

smartctl -a /dev/sdb
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-13-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Vendor: FUJITSU
Product: MAX3147RC
Revision: 0104
User Capacity: 147,086,327,808 bytes [147 GB]
Logical block size: 512 bytes
Rotation Rate: 15000 rpm
Logical Unit id: 0x500000e0137d1e10
Serial number: DQ00P6B00K3R
Device type: disk
Transport protocol: SAS (SPL-3)
Local Time is: Wed Feb 17 16:26:03 2021 EST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Temperature Warning: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK

Current Drive Temperature: 26 C
Drive Trip Temperature: 65 C

Manufactured in week 47 of year 2006
Specified cycle count over device lifetime: 10000
Accumulated start-stop cycles: 36
Elements in grown defect list: 0

Error counter log:
Errors Corrected by Total Correction Gigabytes Total
ECC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 0 2861 0 0 0 106551.613 0
write: 0 974 0 0 0 20344.597 0

Non-medium error count: 83

No self-tests have been logged

NickM
18-02-2021, 00:39
Non-medium error count: 27 »
Non-medium error count: 83 »

Настораживает, но конечно ни о чём...

jonikster
18-02-2021, 01:35
NickM, Если кратко.
1. Стоит ли проводить замену HDD?
2. В дальнейшем при тестировании на что обращать внимание, чтобы понимать, стоит или нет?

NickM
18-02-2021, 06:37
1.
13-15 летние ж/диски это кончено круто.
Замену стоит производить, если у Вас имеется на то основания и потребность - полагаю они у Вас в RAID-1 и под системой? И Вам их по производительности и объему хватает?

2.
Non-medium error count »
Это общая информация и не даёт никакой конкретики.
К сожалению утилита не "раскрыла" весь СМАРТ, ну или ж/д его не отдали.

Для SAS можно контролировать эти параметры:

Error counter log (http://sg.danny.cz/scsi/smartmontools_scsi.html):
read:
write: »

а также лог self-теста, может здесь (http://true-system.blogspot.com/2011/10/sas.html) почерпнете некоторую информацию?
Кстати, self-тест на Ваших лисках ни разу не выполнялся:
No self-tests have been logged»

Jula0071
18-02-2021, 15:02
Для возраста состояние отличное.
Это общая информация и не даёт никакой конкретики. »
Для такого пробега совершенно мизерное количество ошибок. Но конечно возраст... И сейчас наверно сложно будет быстро достать замену, случись что. Я бы поменял заранее, если бюджет на это есть. На ссд, можно даже сата самсунг про, если корзина позволяет.
К сожалению утилита не "раскрыла" весь СМАРТ, ну или ж/д его не отдали. »
SAS часто не отдают явно атрибуты.




© OSzone.net 2001-2012