PDA

Показать полную графическую версию : [решено] Проблемы с SAS контроллером или с жестким?


Страниц : [1] 2

allianceplayer
30-03-2012, 08:06
Доброе утро уважаемые форумчане,

Надеюсь на ваши мудрые советы..

Дело в том что имеется сервер HP ML 150 G5 в нем два жестких SATA 500 Gb Seagate, SAS контроллер SAS1064E, RAID 1 стоит. Все работало прекрасно более двух лет. Проблема началась недели две назад после установки Acronis Console, для удаленного резервного копирования.

На утро пришел NTLDR is Missing перегружаю, нажимаю три волшебных клавиши, пошла перезагрузка. Сервер отказывается видеть RAID controller как будто его там и нет. Выключаю сервер, включаю, контроллер увидел но РЕЙД в состоянии degraded и пошел ребилд дисков. Снес этот Акронис консоль к черту. Ребилд через часов 12-15 завершился, все диски работают нормально зелененькие довольные огоньки мигают.

Прихожу через пару дней опять NTLDR is missing. Ситуация один в один…Смотрю логи…Перезагрузка системы начинается когда Acronis True image server начинает делать дефферентное ежеденевное резервное копирование на месте «Блокировка диска С». Так вот эта ерунда происходит по не понятным для меня причинам, в один вечер сливает бекапы нормально, на второй день при этой же процедуре вылетает.

Так на что мне грешить? На Acronis? Хотя раньше все было нормально. НА один из дисков? Или на Raid контроллер.
Жду ваших мыслей оп этому поводу,
Заранее благодарю.

misha2
03-04-2012, 09:06
allianceplayer,
Вы не указали сами модели винтов. Но в общем случае - раз Сигейты там, то вполне вероятно что на каком-то из них стали появляться дефекты.

allianceplayer
03-04-2012, 13:33
Интересная весч, отключил диферентное копирование на пару дней Акронисом, вроде все в порядке стало....Думаю, если включу, начнется та же самая канитель!!!Ну хотя бы понять причину данного не здорового поведения!!!!

misha2
03-04-2012, 14:04
Тестите винты по отдельности например на другом компе Викторией 4.46. СМАРТ и скан поверхности сделайте обязательно.

allianceplayer
03-04-2012, 14:10
Думаете это однозначно винты?наткнулся вот на такой пост в нете прямо один в один проблема http://blog.karelia.pro/adengin/2007/11/16/windows-skup-na-informaciyu/

Но насколько я понял решением явилось разбитие раида и работой без него!!!

misha2
03-04-2012, 14:26
Поверьте, я знаю как ведут себя Сигейты 11, 12 после работы в рэйде. И проблемы у них появляются ещё до года работы. Собственно, не хотите - не проверяйте винты. Особенно если там не хранится ничего особо важного.

allianceplayer
03-04-2012, 14:57
В том то и дело что там хранится важная инфа...И действительно этим винтам еще полгода нет, как они начали в раиде работать. В случае выявления глюков именно в винтах, рекомендуете их сменить? Винты каких поризводиетелей на Ваш взгляд стоило бы использовать?

misha2
03-04-2012, 15:03
В случае выявления глюков именно в винтах, рекомендуете их сменить? »
А как вы сами думаете ? Особенно, если -
В том то и дело что там хранится важная инфа... »
А винты в рэйд ставят именно рейдовые, типа WD серий RE (Raid Edition), Enterprize (хотя б) или Black, это если говорить про альтернативу Сигейту. Ведь выбор небогат - Самсунг перешёл под крылышко Сигейт, а Хитачи к WD.

allianceplayer
03-04-2012, 15:39
В комплектации с сервером шли два винта Сигейта, с наклейкой HP, только по заоблочным ценам...Так вот через два года работы один из винтов показал красненький фанарик, тем самым дав понять, что он сдох...И реально винт оказался мертвым.... Хотел уже заказывать такой же у HP. Вспомнил что есть такой же винтик в ящичке, только без этой наклеичке HP, вставил, все идеально у меня проработало еще 1,5 года..Пока не пришло время увеличивать дисковое пространство сервера... Купил 2 обычные ничем не примечательные 500 того же Сигейта, ну вот и результат в прицнипе...Буду проверять..,Спасибо БОЛЬШОЕ, за внимание и советы....

allianceplayer
09-04-2012, 07:52
Отписываю о проделанной работе..Вообщем решил я на недельку отключить диферентное копирование, а на выходных просканировать винты...Во время этой недели винту работали нормально, ничего не слетало, все как надо...Даже не смотря на то, что выполнялось полное резервное копирование два раза, тем же Акронисом... Снял Винты проскинаил Викторией, СМАРТ показал что все good...Поверхность тоже чиста, без ошибок....Так что все таки грешу, на какой то сбой в программе Акронис....Лог СМАРТА с винтов ниже...


DISK1


ST500DM002-1BC142 Z2AAZERN
-------------------------------------------------------------------------
ID Name Value Worst Tresh Raw Health
-------------------------------------------------------------------------
1 Raw read error rate 114 99 6 81384967 •••••
3 Spin-up time 100 100 0 0 •••••
4 Number of spin-up times 100 100 20 53 •••••
5 Reallocated sector count 100 100 36 0 •••••
7 Seek error rate 77 60 30 51406642 •••
9 Power-on time 98 98 0 2125 ••••
10 Spin-up retries 100 100 97 0 •••••
12 Start/stop count 100 100 20 53 •••••
183 unknown attribut 100 100 0 0 •••••
184 End-to-End error 100 100 99 0 •••••
187 Reported UNC error 100 100 0 0 •••••
188 Command timeout 100 96 0 4295098403 •••••
189 High Fly writes 100 100 0 0 •••••
190 Airflow temperature 81 63 45 19°C/66°F ••••
194 HDA Temperature 19 40 0 19°C/66°F ••••
194 Minimum temperature 90 40 0 14°C/57°F -
195 Hardware ECC recovered 46 33 0 81384967 ••
197 Current pending sectors 100 100 0 0 •••••
198 Offline scan UNC sectors 100 100 0 0 •••••
199 Ultra DMA CRC errors 200 200 0 0 •••••
240 Head flying hours 100 253 0 254347963271389 •••••
241 unknown attribut 100 253 0 1578186213 •••••
242 unknown attribut 100 253 0 948735500 •••••




DISK2
ST500DM002-1BC142 Z2AAZER7
-------------------------------------------------------------------------
ID Name Value Worst Tresh Raw Health
-------------------------------------------------------------------------
1 Raw read error rate 117 99 6 153842852 •••••
3 Spin-up time 100 100 0 0 •••••
4 Number of spin-up times 100 100 20 40 •••••
5 Reallocated sector count 100 100 36 0 •••••
7 Seek error rate 77 60 30 55460101 •••
9 Power-on time 98 98 0 2426 ••••
10 Spin-up retries 100 100 97 0 •••••
12 Start/stop count 100 100 20 39 •••••
183 unknown attribut 100 100 0 0 •••••
184 End-to-End error 100 100 99 0 •••••
187 Reported UNC error 100 100 0 0 •••••
188 Command timeout 100 99 0 4295032849 •••••
189 High Fly writes 100 100 0 0 •••••
190 Airflow temperature 69 60 45 31°C/87°F ••••
194 HDA Temperature 31 40 0 31°C/87°F ••••
194 Minimum temperature 90 40 0 13°C/55°F -
195 Hardware ECC recovered 46 30 0 153842852 ••
197 Current pending sectors 100 100 0 0 •••••
198 Offline scan UNC sectors 100 100 0 0 •••••
199 Ultra DMA CRC errors 200 200 0 0 •••••
240 Head flying hours 100 253 0 14843406977496 •••••
241 unknown attribut 100 253 0 2374139564 •••••
242 unknown attribut 100 253 0 3152625376 •••••

misha2
09-04-2012, 08:34
Вот теперь понятно, что Сигейты 12-й серии, обычные, не серверные, из новых. СМАРТы хорошие у обоих. Немного получше обычных 12-х. Можно считать что общее состояние у них хорошее и проблем нет пока. Будем считать что сбой был всё-таки софтовый. Единственное, что при вылете такого винта, поднимать его непростая задача, особенно если на момент вылета там будет находиться ценная инфа. Просто учитывайте, что эти Сигейты вылетают обычно резко, внезапно. Поэтому за ними нужно следить и любой сбой подозрителен.

allianceplayer
09-04-2012, 12:04
misha2

Спасибо за Ваше доброе отношение и комментарии по проблеме..... Насколько я понимаю, все таки ваши рекомендации сводятся к смене данных винтов, на приведенные Вами модели выше!?

misha2
09-04-2012, 12:17
В основном да. Хотя б потому, что в серверах с ценными данными должны стоять винты с повышенной надёжностью. А обычные Сигейт 12 к таковым не относятся. Тем более уж частенько неприятности с серверами упоминаются в связи с Сигейт 11, 12, на разных форумах.

allianceplayer
14-04-2012, 13:23
Вы были абсолютно правы, дело в винтах...На днях опять перестал загружаться....Начал проверять один из винтов на ошибки на другом компе, а он висит на надписи Correcting error....Хотелось бы попросить, из Вашего личного опыта...Какую конкретную модельку из винтов WD вы можете посоветовать!?

Спасибо..

misha2
14-04-2012, 13:34
Вообще то для серверов подходят WD серий RE2, RE4, Enterprize, и Black ещё...

allianceplayer
14-04-2012, 13:51
Спасибо за подсказку....Будем искать....А то реально, что то как то не нравится мне совсем как они работают!!!!

misha2
14-04-2012, 14:09
Я б всё-таки посмотрел бы их СМАРТ на стационарном, обычном компе Викторией 4.46. Чтоб быть уже уверенным.

allianceplayer
14-04-2012, 15:27
Так я же и выставил логи, что показала виктория..Показала что все гууд...И сейчас тоже показывает...Скинирую естественно на другом компьютере!!!!

misha2
14-04-2012, 15:46
Да, на тех логах всё более-менее. А сканировали поверхность ? Ещё Сигейты страдают окислением контактных площадок с обратной стороны платы и их чистят ластиком. Из-за окисления винты могут сбоить тоже, запросто.

allianceplayer
15-04-2012, 18:05
Поверхность так же сканировал...Все чисто никаких бедов и прочего, было несколько кластеров с задержками 200 ms, ну я думаю это не настолько критично, чтобы падать....Контакты так же чистил ластиком, один черт какая я то ерунда выходит....Сейчас уже до того дошло, что сервер загружается когда захочет,обновился допустим, перезагрузился, а загружатся не хочет.....Сказал мол ему надо на ошибки винты проверить, хотя за день до этого два винта проверял, chkdsk ошибки поправил....Сейчас сервер делает ресинхронизацию и на ошибки проверяет третий час...Вот и не могу понять то ли он завис, так как даже намлок не реагирует, то ли работает....Вообщем с самого начала Вы правильно говорили глючные это винты, это уже не тот Сигейт что был раньше.....




© OSzone.net 2001-2012