23 января 2019 г.

Про потерю данных - 2

Где-то месяц назад система мониторинга домашнего сервера сообщила мне что на 2-терабайтном зелёном Вестерне в 2 приёма внезапно образовалось полторы тысячи секторов, ожидающих ремаппинга. Сан-Хосе, подумал я, - у нас проблема.

К счастью, на этом диске не было ничего такого что терялось бы безвозвратно. О правильном размещении данных я позаботился с самого начала. Но тем не менее, файлы надо было спасать и какое-то время у меня это заняло, потому что скорость доступа деградировала значительно. Сначала попробовал сливать по сети, но столкнулся с постоянными таймаутами, от которых сетевое копирование всё время прерывалось. В результате копировал уже локально, но внутри виртуалки, прежде чем начинать заморачиваться и уходить глубже, к гипервизору. Странно, но в конце концов я всё даже перелил.

Пока шёл процесс, я стал смотреть что купить на замену. Немного подумав, решил перейти на следующий уровень и минимальным объёмом для себя установил 6 ТБ. Стал смотреть, чего есть из небыстрых, но холодных моделей и офигел. Во-первых, производителей осталось всего двое: Вестерн и Сигейт. Во-вторых, Вестерн прекратил выпуск зелёных дисков и теперь вместо неё выпускает красные и пурпурные. HGST теперь - кровавый энтерпрайз в Вестерне. Пышущие жаром 10-15 тыс. оборотов за несметные деньги - чересчур дорогое удовольствие для дома. В результате в шортлисте осталось 3 семейства: красное и пурпурное от Вестерна и барракуда от Сигейта. Цены Вестерна тоже не обрадовали, Сигейт стоил процентов на 15-20 дешевле.

Надо сказать, что у меня был неприятный опыт с разными моделями Сигейтов и я давно ничего от них не покупал, а тут решил попробовать. Позвонил знакомому поставщику, попросил подогнать мне диск. А он и говорит, что ровно эта модель привода устанавливается во внешний накопитель, который при этом стоит ещё на пару тысяч дешевле. Странная экономика, но кто я такой чтобы сопротивляться желанию ТАК сэкономить? В общем, на следующий день у меня был внешний диск от Сигейт с 6 ТБ внутри. По доброй установившейся традиции вскрыть диск просто так не получилось. Вместо болтов там всё на защёлках, половину которых я в процессе благополучно сломал. Полюбовался на новенький, с иголочки диск, муха не сидела - производство-то чистое всё же.

Открыл сервер, увидел сколько там накопилось дерьма за те годы что он тихо шуршал себе. Пыль и кошачья шерсть. Пообещал ему что обязательно его почищу, но позже. Подключил диск, убедился что XenServer его благополучно увидел. Поднял минимально необходимый для жизни комплект виртуалок и оставил его крутиться вхолостую. Через день посмотрел на SMART. МАМАДОРОГАЯ! У диска пробег 24 часа, 2 включения/отключения и количество ошибок поиска, исчисляющееся миллионами. А ошибок чтения - десятками миллионов! И эти числа непрерывно растут.

Звоню поставщику, описываю ситуацию, отправляю ужасные скриншоты. А он всё-таки продавец, ни разу не IT-про, поэтому некоторые вещи пришлось объяснять. Дошло, что с такими показателями не живут. Ладно, говорит, привози, поменяю. Привожу как было - россыпью. Он офигевает от увиденного, но делать нечего - пообещал же. Забрал. Через день курьер привозит новый.

Но я-то теперь умный. Прежде чем начинать разламывать коробку, я подключил диск как было задумано производителем - по USB и посмотрел SMART. К увиденному я был уже морально готов. Пробег - ноль часов и миллионы ошибок чтения и поиска. Нафиг такая экономия.

Начинаю  изучать чем отличается красная серия от пурпурной. Цифры одни и те же, а позиционирование отличается. Решил для себя, что раз красная - это NAS, то мне годится лучше чем пурпурная, предназначенная для видеонаблюдения (интересно, почему такое узкое позиционирование?). В процессе придумывается аббревиатура, описывающая это позиционирование. WORSE - Write Only Read Seldom. Думаю, с этой аббревиатурой им ни одного экземпляра не продать.

Звоню поставщику, договариваюсь что он заберёт этот несчастный Сигейт взад, а мне привезёт красный Вестерн. В общем, никакой экономии не случилось, потратил куда больше чем мне хотелось первоначально. Но с этим всегда так.

Как и обещал серверу, разобрал его, вычистил до состояния "Почти как новенький". В процессе нашёл один вентилятор, который так забился шерстью, что тихо умер. А вентилятор не копеечный, а Noctua. Так что пришлось потратиться ещё. Чтоб следующий раз так не попадать, сколхозил сеточки, которыми прикрыл все воздухозаборники.

Дальше было по накатанной. Собрать сервер, подключить диск, загрузиться, увидеть что всё в порядке. Ну и создавать тома, подключать к виртуалкам и всё такое.

Вот такие показатели теперь рапортует мне мониторинг. Красота.





А тем временем, на днях Backblaze опубликовали очередную статистику надёжности дисков, теперь за 2018 год. Купленный мной 6-терабайтный WDC там тоже есть и показывает достаточно высокие показатели отказов. Это неприятно. Остаётся надеяться, что мой экземпляр эту статистику посрамит.

Комментариев нет: