Как качество электроэнергии влияет на серверы, компьютеры и ИТ-инфраструктуру
Современная ИТ-инфраструктура зависит не только от процессоров, сетевых коммутаторов, систем хранения данных и программного обеспечения. Один из ключевых факторов стабильной работы серверов, рабочих станций, активного сетевого оборудования и систем автоматизации — качество электропитания.
На практике многие сбои в работе ИТ-оборудования возникают не из-за «зависшего сервера», неудачного обновления или внутреннего дефекта, а из-за кратковременных событий в электрической сети. Это могут быть провалы напряжения, импульсные перенапряжения, скачки, переходные процессы и другие отклонения, которые для человека остаются незаметными, а для электроники становятся причиной перезагрузок, зависаний, ошибок, повреждения блоков питания или выхода оборудования из строя.
Самое неприятное в таких событиях — их случайный характер. Они могут длиться доли секунды, но этого достаточно, чтобы сервер, контроллер, маршрутизатор или промышленный компьютер начали работать нестабильно. Электрика, как обычно, умеет испортить день быстрее любого системного администратора.
Какие события в сети опасны для ИТ-оборудования
Наиболее распространённые причины кратковременных отклонений напряжения:
- аварии и переключения в распределительных сетях;
- грозовые разряды и атмосферные перенапряжения;
- включение мощных электродвигателей, компрессоров, насосов, лифтов и другого оборудования;
- работа сварочных аппаратов, частотных преобразователей и нелинейных нагрузок;
- переходные процессы при переключении источников питания;
- ошибки в системе заземления или электроснабжения объекта;
- некорректная работа ИБП, ДГУ, АВР или стабилизаторов.
Для ИТ-оборудования особенно опасны не только длительные отклонения напряжения, но и короткие события. Например, провал напряжения на несколько десятков миллисекунд может привести к перезагрузке компьютера или сетевого оборудования. Импульсное перенапряжение может повредить блок питания, сетевую карту или чувствительную электронику.
Почему сложно сразу понять причину сбоя
Когда сервер или компьютер внезапно перезагружается, часто первым делом проверяют программное обеспечение, операционную систему, память, диски, драйверы и сетевые настройки. Это логично, но не всегда достаточно.
Если сбои повторяются нерегулярно, происходят в разное время и не имеют очевидной программной причины, необходимо проверить внешние факторы. Один из главных таких факторов — электропитание.
Главный вопрос звучит так: оборудование неисправно само по себе или оно реагирует на события в сети? Ответить на него «на глаз» невозможно. Нужны измерения, регистрация событий и последующий анализ.
Что такое диаграмма CBEMA / ITIC
Для оценки устойчивости компьютерного и делового оборудования к отклонениям напряжения была разработана специальная диаграмма, известная как CBEMA. Позднее её развитие получило название ITIC.
Эта диаграмма показывает, какие кратковременные отклонения напряжения оборудование обычно должно выдерживать без сбоев, а какие события уже могут привести к перезагрузке, отказу или повреждению.
Проще говоря, CBEMA / ITIC — это карта риска для электроники. На неё наносятся реальные события, зарегистрированные в сети: провалы напряжения, перенапряжения и переходные процессы. После этого можно увидеть, находятся ли они в безопасной области или попадают в зоны, где оборудование может работать нестабильно.
Какие параметры учитывает диаграмма
Каждое событие в электрической сети описывается двумя основными параметрами:
- длительность события — сколько времени напряжение находилось вне нормального диапазона;
- глубина или величина отклонения — насколько напряжение отличалось от номинального значения.
Например, кратковременный импульс перенапряжения может длиться микросекунды, но иметь очень большую амплитуду. Провал напряжения может быть менее резким, но продолжаться десятки или сотни миллисекунд. Для оборудования важны оба параметра.
Очень короткое событие может не успеть повлиять на оборудование. Но если отклонение длится дольше, даже сравнительно небольшое снижение или повышение напряжения может вызвать сбой. Именно поэтому обычного мультиметра или разовой проверки напряжения недостаточно. Нужно видеть динамику и фиксировать события с высокой временной точностью.
Три зоны на диаграмме CBEMA / ITIC
Диаграмма условно делится на несколько зон.
1. Зона нормальной работы
Если зарегистрированные события попадают в эту область, считается, что типовое ИТ-оборудование должно продолжать работу без сбоев. Если при этом серверы, компьютеры или сетевые устройства всё равно перезагружаются, необходимо искать внутренние причины: дефекты блоков питания, неисправности оборудования, перегрев, ошибки в настройках или проблемы с программным обеспечением.
2. Зона опасных перенапряжений
События в этой области могут не только вызвать сбой, но и физически повредить оборудование. Особенно уязвимы блоки питания, сетевые интерфейсы, электронные платы, контроллеры и чувствительная измерительная техника.
Если такие события фиксируются на объекте, необходимо рассматривать применение устройств защиты от импульсных перенапряжений, проверку заземления, корректность схемы электроснабжения и состояние распределительных щитов.
3. Зона провалов напряжения
События в этой зоне могут приводить к перезагрузкам, зависаниям, ошибкам записи данных, отключению сетевого оборудования и аварийному завершению процессов.
Для серверных, ЦОД, систем видеонаблюдения, АСУ ТП и промышленных контроллеров такие события особенно критичны. Там даже кратковременный сбой может вызвать простой, потерю данных или нарушение технологического процесса.
Как диаграмма помогает найти причину сбоев
Главная ценность диаграммы CBEMA / ITIC в том, что она позволяет перейти от догадок к инженерной диагностике.
Если в момент сбоя были зафиксированы события, которые попадают в опасные зоны диаграммы, есть основание считать, что причина связана с качеством электропитания. В таком случае необходимо подбирать техническое решение: ИБП, стабилизатор напряжения, устройство защиты от импульсных перенапряжений, активный фильтр гармоник, корректировку схемы заземления или изменение структуры электроснабжения.
Если же все зарегистрированные события находятся в зоне нормальной работы, а оборудование всё равно сбоит, вероятнее всего, причина находится внутри самого оборудования или его программной среды.
Это особенно полезно при спорных ситуациях между эксплуатацией, ИТ-службой, поставщиком оборудования и подрядчиком. Диаграмма даёт не мнение, а измеренные данные. А с измеренными данными спорить сложнее, хотя некоторые всё равно героически пытаются.
Какие приборы нужны для анализа
Для построения диаграммы CBEMA / ITIC нужны анализаторы качества электроэнергии, способные регистрировать кратковременные события: провалы, всплески, перенапряжения, переходные процессы и другие нарушения.
Важно, чтобы прибор фиксировал не только средние значения напряжения и тока, но и быстрые события с высокой временной детализацией. Обычные счётчики электроэнергии и простые регистраторы для этого не подходят. Они могут показать потребление, но не объяснят, почему сервер перезагрузился в 03:17, а коммутатор внезапно решил покинуть этот мир.
Для таких задач применяются профессиональные анализаторы качества электроэнергии, например приборы Janitza, которые могут регистрировать события, сохранять архив данных и передавать информацию в программное обеспечение для анализа.
Что можно увидеть при измерениях
При правильной установке анализатора качества электроэнергии можно получить объективную картину происходящего в сети:
- когда именно произошёл провал или скачок напряжения;
- на какой фазе возникло событие;
- какой была глубина провала;
- сколько миллисекунд или микросекунд длилось отклонение;
- было ли событие связано с включением мощной нагрузки;
- повторяются ли нарушения регулярно;
- какие события совпадают по времени со сбоями оборудования;
- нужен ли ИБП, стабилизатор, УЗИП, фильтр гармоник или другое решение.
Это позволяет не просто «поставить ИБП на всякий случай», а подобрать решение под реальную проблему. Потому что универсальная фраза «поставьте ИБП» звучит красиво, но в промышленности иногда так решают одну проблему и создают три новых.
Почему ИБП не всегда решает проблему полностью
Источник бесперебойного питания действительно защищает нагрузку от многих проблем: кратковременных провалов, отключений, части перенапряжений и нестабильности сети. Но выбор ИБП должен быть инженерным, а не бытовым.
Нужно учитывать:
- мощность и характер нагрузки;
- пусковые токи оборудования;
- требуемое время автономии;
- наличие байпаса;
- совместимость с ДГУ;
- требования к форме выходного напряжения;
- уровень гармоник в сети;
- температурные условия и вентиляцию;
- требования к мониторингу и сервису.
Для серверных и ЦОД часто применяются ИБП двойного преобразования. Для рабочих мест, сетевого оборудования, систем видеонаблюдения или отдельных шкафов автоматики могут использоваться другие схемы защиты. Но в любом случае подбор должен начинаться с анализа объекта.
Где особенно важно контролировать качество электроэнергии
Диагностика качества электропитания особенно важна для объектов, где сбой электроники приводит к прямым финансовым или технологическим потерям:
- центры обработки данных;
- серверные комнаты;
- офисы с критичной ИТ-инфраструктурой;
- промышленные предприятия;
- системы АСУ ТП и диспетчеризации;
- медицинские учреждения;
- телекоммуникационные узлы;
- банковская инфраструктура;
- склады с автоматизацией и WMS-системами;
- объекты с большим количеством сетевого оборудования.
На таких объектах сбой питания редко ограничивается одной перезагрузкой. Он может привести к простою, потере данных, нарушению связи, остановке технологического процесса или повреждению оборудования.
Как ZEUSELECTRO помогает найти и устранить проблему
ZEUSELECTRO выполняет обследование систем электроснабжения, анализ качества электроэнергии и диагностику причин сбоев оборудования. Мы помогаем определить, связаны ли отказы серверов, компьютеров, сетевого оборудования, промышленных контроллеров или ИБП с параметрами питающей сети.
В рамках работ могут выполняться:
- измерения качества электроэнергии по ГОСТ 32144-2013;
- регистрация провалов, перенапряжений и переходных процессов;
- построение и анализ диаграммы CBEMA / ITIC;
- поиск связи между событиями в сети и сбоями оборудования;
- анализ гармоник, перекоса фаз и реактивной мощности;
- проверка работы ИБП, ДГУ, АВР и систем заземления;
- подбор решений для повышения надёжности электропитания;
- подготовка технического отчёта с выводами и рекомендациями.
По результатам обследования можно понять, какое решение действительно необходимо: промышленный ИБП, стабилизатор напряжения, устройство защиты от импульсных перенапряжений, активный фильтр гармоник, модернизация схемы электроснабжения или настройка существующего оборудования.
Вывод
Качество электроэнергии напрямую влияет на стабильность работы ИТ-инфраструктуры. Кратковременные провалы, перенапряжения и переходные процессы могут вызывать перезагрузки серверов, сбои сетевого оборудования, ошибки в работе компьютеров и повреждение электроники.
Диаграмма CBEMA / ITIC позволяет оценить, насколько зафиксированные события опасны для оборудования, и помогает отделить проблемы электропитания от внутренних неисправностей техники.
Если на объекте регулярно происходят необъяснимые сбои ИТ-оборудования, не стоит ограничиваться заменой блоков питания и перезагрузкой серверов. Гораздо разумнее измерить качество электроэнергии, зафиксировать события в сети и принять решение на основе данных. Электричество всё равно оставит следы. Главное — поставить прибор, который умеет их увидеть.

