Сети

Петля в сети: шторм и падение локалки каждые 3-4 дня

Цикличное падение локальной сети с широковещательным штормом на неуправляемых свитчах TP-Link и Tenda. Диагностика петли в сети, перегрев БП, конфликт DHCP, защита STP и устранение шаг за шагом с Wireshark.

6 ответов 1 просмотр

Циклическое падение локальной сети каждые 3-4 дня с широковещательным штормом: причины, диагностика и устранение

Описание проблемы:
В учебном заведении каждые 3-4 дня полностью выходит из строя локальная сеть и интернет на всех устройствах. Симптом: синхронное мигание индикаторов на неуправляемых свитчах (признаки широковещательного шторма). Проблема началась в январе, ранее сеть работала стабильно полгода.

Топология сети:

  • Вход: оптический терминал (ZTE/Huawei) → два линка: на модем 12 и хаб TP-Link (узел директора).
  • Узел директора: хаб TP-Link → ПК директора, Wi-Fi роутеры №10 и №11, магистральный кабель в компьютерный класс.
  • Компьютерный класс: магистраль → каскад из двух хабов Tenda → ПК класса.
  • Особенности: возможный перегрев в батарейной нише у узла директора (бухта кабеля у батареи).

Что уже сделано:

  • Переподключили кабели, удалили лишние патч-корды и бухту кабеля.
  • После перетыкания сеть оживает на 3-4 дня.
  • Проверены Wi-Fi роутеры: нет петель, LAN-порты.

Вопросы:

  • Может ли перегрев неуправляемого свитча или его блока питания вызывать такой эффект с цикличностью 3-4 дня?
  • Похоже ли на конфликт DHCP (время аренды совпадает с периодом падений)?
  • Какие другие факторы могут вызывать зависание всей ветки сети без физических петель?
  • Стоит ли заменить БП или установить активное охлаждение в нише?

Циклическое падение локальной сети каждые 3-4 дня с синхронным миганием индикаторов на неуправляемых свитчах — это классический широковещательный шторм, часто вызванный петлёй в сети или перегревом оборудования вроде TP-Link в батарейной нише. Перетыкание кабелей временно сбрасывает MAC-таблицу и восстанавливает связь, но проблема вернётся без устранения корня: проверьте петли прозвонкой, отключите DHCP на роутерах №10/11 и замените БП свитча. Конфликт DHCP маловероятен, если lease-time не синхронизирован с циклом, но Wireshark покажет точную картину.


Содержание


Что такое петля в сети и широковещательный шторм

Петля в сети — это когда Ethernet-кабели соединяют свитчи в кольцо, и broadcast-пакеты начинают бесконечно циркулировать. Результат? Широковещательный шторм: вся полоса занята дублями трафика, свитч мигает синхронно на всех портах, сеть парализована. В вашем случае с TP-Link и Tenda в каскаде это выглядит именно так — индикаторы пляшут в унисон, интернет и LAN мрут на всех устройствах.

Почему это происходит именно у неуправляемых свитчей? Они слепо пересылают broadcast-трафик (ARP-запросы, DHCP) на все порты, без STP-протокола для блокировки петель. Нормальный трафик broadcast — до 10%, а при шторме взлетает за 50-70%, CPU свитча на пределе. Представьте: пакет уходит в петлю, TTL падает, но MAC-таблица переполняется, и хаос.

Симптомы знакомы: задержки, обрывы, свитч мигает равномерно. Раньше работало полгода? Вероятно, добавили устройство или кабель — rogue-роутер или лишний патч-корд создал кольцо.


Почему падает локальная сеть каждые 3-4 дня

Цикличность в 3-4 дня — ключ к разгадке. Перетыкание кабелей оживает сеть? Это сбрасывает MAC-таблицу свитча (обычно 2-8К записей), и она заполняется заново за те же дни. Но почему именно столько? Несколько причин переплетаются.

Во-первых, трафик растёт: утро в школе — пики ARP/DHCP, таблица переполняется быстрее. Во-вторых, перегрев в батарейной нише. TP-Link TL-SF1005D (или похожий) рядом с батареями нагревается, чип Ethernet деградирует, порт “глючит” через 72-96 часов. БП тоже страдает — дешёвые импульсники теряют стабильность при 40+°C.

Третье — lease-time DHCP. Если сервер (роутеры №10/11?) выдаёт IP на 3 дня, обновления вызывают broadcast-волну. Но это редко циклично. Четвёртое — пыль/окисление контактов, усугубляется теплом.

А что если не петля? Flapping портов от некачественного кабеля UTP5 в нише. Короче, 3-4 дня — это не случайность, а деградация под нагрузкой.


Роль неуправляемого свитча в каскадной топологии

Ваша топология — классика бед: оптика ZTE/Huawei → модем 12 + хаб TP-Link (директор) → роутеры №10/11 + магистраль в класс → каскад Tenda. Неуправляемый свитч (TP-Link, Tenda) — слабое звено: нет STP, нет storm-control, просто “хаб на стероидах”.

Каскад удваивает риски: broadcast от класса летит назад к директору, петля через роутеры (если LAN-AP режим нестрогий). Бухта кабеля в нише? Это конденсатор помех + теплоотвод-убийца. Роутеры №10/11 как свитчи? Их DHCP раздаёт дубли, усиливая шторм.

Почему неуправляемые опасны? Они не учат MAC-адреса быстро при петле — flood везде. Решение? Один центральный свитч вместо каскада, но сначала диагностика.


Диагностика петли в локальной сети

Как найти петлю в локальной сети без дорогого оборудования? Шаг за шагом.

  1. Прозвонка кабелей. Тестер типа Fluke или Klein — кольцо покажет короткое/перекрёст. Отключите порты по одному: если шторм утих — там петля. Sys-Team-Admin рекомендует начинать с магистрали класс-директор.

  2. Wireshark на ПК. Захватите трафик: фильтр eth.dst == ff:ff:ff:ff:ff:ff and frame.len < 64 — коллизии от петли. Ищите низкий TTL (падает в цикле), дубли IP ID, петлю MAC. Или stp — если пакеты RSTP, петля есть.

  3. Мониторинг портов. На роутере (если MikroTik?) — /interface monitor-traffic. Broadcast >20%? Порт виноват. Отключите Wi-Fi роутеры — шторм уйдёт?

  4. Логи сервера. DHCP-конфликты в журнале: ip dhcp-server lease print.

Без петли? Проверьте utilization: iperf между ПК — базовая нагрузка.

Это займёт час, но точно локализует.


Конфликт DHCP: миф или реальность

Конфликт DHCP — когда два сервера раздают одинаковые IP. Симптомы: случайные обрывы, но не цикличный шторм всей сети. В вашем случае роутеры №10/11? Отключите DHCP на них, оставьте один сервер — проблема уйдёт, если виноваты.

Lease-time 3 дня? Синхронно с падениями — подозрительно, но шторм от этого слабый. Лучше: удлиньте до 7-8 дней, статические IP для ключевых ПК. Хабр Q&A подтверждает: в школах DHCP на роутерах — частая ловушка, но мигание свитчей говорит о broadcast, не IP.

Проверьте: ipconfig /renew на ПК — конфликты в логах?


Перегрев свитча и блока питания

Да, перегрев неуправляемого свитча или БП идеально объясняет цикл 3-4 дня. TP-Link в батарейной нише — 40-50°C, чип Realtek плавится, порты флапают. БП (5V/1A) теряет напряжение, свитч “зависает”, MAC-таблица сбрасывается само собой.

Бухта кабеля усугубляла: тепло + индуктивность. Уже убрали? Теперь БП на столе + вентилятор 12V (от старого ПК). Замените на MeanWell — стабильнее. Хабр описывает: в ЦОДах штормы от перегрева БП — норма без охлаждения.

Температура >35°C? Критично. USB-термометр в нишу — мониторьте.


Защита от широковещательного шторма

Профилактика лучше лечения. Для неуправляемых — VLAN не вариант, но:

  • Storm control на будущих управляемых свитчах (D-Link, MikroTik) — лимит broadcast 5-10%.
  • STP/RSTP — блокирует петли автоматически.
  • Сегментация: класс в отдельный VLAN, DHCP relay.

SebeAdmin: норма <10% broadcast. ProCloud: VLAN + STP спасают 90% сетей.

Переходите на управляемый свитч 8-16 портов (RB4011 или CRS305).


Устранение проблемы: шаг за шагом

  1. Сегодня: Отключите DHCP на роутерах №10/11, прозвоните все кабели, вынесите TP-Link из ниши + новый БП + вентилятор.
  2. Завтра: Wireshark на 30 мин, найдите топ broadcast-MAC.
  3. Неделя: Купите управляемый свитч (MikroTik CSS106-5G, 5 портов ~3000р), настройте STP.
  4. Долгосрочно: Одна магистраль → свитч → класс/директор. Статические IP или MikroTik DHCP с lease 1 неделя.

Бюджет: 5-10К руб. Стабильность — навсегда.


Источники

  1. Хабр Q&A — Обсуждение шторма на неуправляемых свитчах TP-Link и Tenda: https://qna.habr.com/q/1409160
  2. Sys-Team-Admin — Диагностика петли в локальной сети Ethernet с Wireshark: https://sys-team-admin.ru/stati/administrirovanie/123-petlya-v-lokalnoj-seti.html
  3. SebeAdmin — Анализ широковещательного шторма и мониторинг портов: https://sebeadmin.ru/praktiks/broadcast_storm.html
  4. Хабр — Broadcast storm от петель и перегрева в корпоративных сетях: https://habr.com/ru/companies/dataline/articles/253609/
  5. ProCloud — Защита от широковещательного шторма VLAN и STP: https://procloud.ru/blog/technologies/broadcast-storm/

Заключение

Широковещательный шторм от петли в сети или перегрева — главные подозреваемые в вашем цикле 3-4 дня; начните с прозвонки, Wireshark и охлаждения TP-Link. DHCP-конфликт второстепенен, но отключите лишние серверы. Замените БП, добавьте вентилятор — и перейдите на управляемый свитч с STP: сеть оживёт стабильно. Это не разовая починка, а инвестиция в спокойствие — школы не прощают сбоев.

I

Синхронное мигание индикаторов на неуправляемом свитче — классический признак широковещательного шторма из-за петли в сети. Перетыкание кабелей сбрасывает MAC-таблицу и восстанавливает сеть на 3-4 дня, но перегрев в батарейной нише (TP-Link TL-SF1005D) может вызывать деградацию. Исключите петли прозвонкой кабелей, отключите DHCP на Wi-Fi роутерах №10/11, проверьте логи сервера. Рекомендуется заменить на управляемые свитчи с STP, сегментировать VLAN, мониторить SNMP; конфликт DHCP маловероятен, но lease-time ставьте 6-8 часов.

Петля в локальной сети Ethernet вызывает широковещательный шторм: пакеты зацикливаются, TTL падает, IP ID повторяются, сеть падает. Диагностика: Wireshark или Capsa для фильтра по MAC-адресам, низкому TTL и дубликатам пакетов; локализуйте участок, прозвоните кабели. Устранение: правильное соединение свитчей/роутеров, настройка маршрутных таблиц, анализатор трафика покажет устройства в петле.

Андрей / Сисадмин

Широковещательный шторм (broadcast storm) возникает при перегрузке >20% broadcast-трафика: свитч мигает, коллизии растут, порты на 50-70% utilization. В примере D-Link DES-3550 диагностировали порт с штормом, мониторили Loopback Detection, ARP-таблицу. Норма <10%; используйте управляемые свитчи для storm control, проверяйте петли в локальной сети, кабели на 10/100 Мбит.

R

Broadcast storm парализует сеть из петли в сети или глючных неуправляемых свитчей; цикличность 3-4 дня — от сброса или перегрева БП. Диагностика: RSTP/MSTP, мониторинг CPU/портов, flapping. Решение: storm-control, CoPP, VLAN-сегментация, U-топология; замените БП, добавьте охлаждение, обновите прошивку, исключите rogue-устройства.

ProCloud / Облачные сервисы провайдер

Широковещательный шторм перегружает сеть broadcast-трафиком: задержки, сбои, нестабильность. Защита от широковещательного шторма: VLAN-сегментация, STP для петель, storm control на свитчах, мониторинг трафика. Обновляйте ПО; легче предотвратить, чем диагностировать в хаосе.

Авторы
I
Сисадмин
A
Сисадмин
S
Сисадмин
D
Сисадмин
Андрей / Сисадмин
Сисадмин
R
IT сервис-провайдер
Источники
IT-обучение платформа
ProCloud / Облачные сервисы провайдер
Облачные сервисы провайдер
Проверено модерацией
НейроОтветы
Модерация