Omnia NAS - restarty routeru při vytížení disků


#1

Ahoj!
Jak jsem popisoval v jiném tématu, řeším poslední dobou časté samovolné restarty routeru (Připojení Omnie přes UPS a časté restarty routeru - v druhém tématu se to týká připojení routeru přes UPS).

Dnes jsem však router odpojil od UPS a vypozoroval jsem, že se docela často restartuje pokud “zatížím” disky.
Snažil jsem se dnes nakopírovat obraz disku z notebooku (cca 250GB) a začnu-li kopírovat, router se po chvilce celkem spolehlivě restartuje.

Mám Omnii s NAS boxem, uvnitř 2 disky (Seagate NAS HDD 4TB a WD Red 3TB WD30EFRX), jednu wifi kartu a ventilátor a v USB zapojen flash disk a přes usb hub DVB-T kartu a WiFi kartu. Je možné, že by to zdroj Omnie nezvládal?
Nechal jsem si vypisovat /var/log/messages a průběžně teplotu a restartu nepředchází nic podivného.
Je nějaká možnost, jak zjistit kde je problém?


Připojení Omnie přes UPS a časté restarty routeru
Samovolné restartování: Omnia i 1.x
Samovolné restartování: Omnia i 1.x
#2

Nejjednodušší asi bude tomu zdroji ulevit, něco odpojte a vyzkoušejte to znovu, já mám tedy jen Turris 1.0, ale nic takového jsem nepozorovat ani při hodně velké zátěži


#3

Možná budu úplně mimo, ale zkusil bych se zajímat o i tu teplotu. Mé pokusy se 2 větráčky (jeden vzduch nasává, druhý vypouští ven) v NAS boxu ukazují, že teplotu lze relativně viditelně srazit (hlavně dochází k proudění) - jen je tam problém s místem pro všechnu tu kabeláž, což si myslím, že je celkem závažná věc, a po zapojení disků to může být opravdu hodně natěsno. Dva disky a řadič prostě místo zaberou a teplo také vydají, pokud teplý vzduch uvnitř šasí zůstává a nejde ven, tak by to také mohla být příčina. Z tohoto pohledu si myslím, že při takovémto plném osazení se již naráží na limity HW TO i samotných šasí - NAS box je sice oproti klasickému krytu větší, ale když se začnou do routeru přidávat disky, karty a větráček/větráčky, tak to je již hodně těsné a dle mého názoru by v tomto případě bylo vhodnější mít takové šasi, ve kterém bude více místa (konec nachmoustaným kabelům na posledních zbytcích místa uvnitř routeru) a bude do něj možné instalovat větší větráčky, které budou efektivnější.


#4

A co buffered memory?


#5

Pokud máte USB TTL kabel, pak doporučuji logovat nějakým jiným zařízením co se děje na sériové lince (https://www.turris.cz/doc/cs/troubleshooting/serial_link). Podle toho jestli zareaguje kernel by mělo být jasné co se děje. Pokud se router restartuje zcela bez chybové zprávy na konzoli, pak je jasné, že došlo k poklesu napájení a restartu cpu ochrannými obvody. Pokud ne, tak budete mít chybovou zprávu s kterou se můžete posunout dále.


#6

Taky je docela dost možné, že je zdroj vadný.


#7

Díky za nástřel, kabel pro sériovou linku mám, zkusím si najít chvilku a vyzkoušet to (asi až příští víkend). Prozatím jsem odpojil USB WiFi a uvidím jestli to trochu nepomůže…


#8

O víkendu (jak už to tak bývá) času nazbyt nebylo, nicméně jsem alespoň zkusil trochu zatížit disky a problém se znovu neobjevil. Takže mi přijde (předběžně), že byl problém v limitním vytížení zdroje a po odpojení USB Wifi karty jsem pod kritickou hranicí zatížení a zdá se to být ok.
Aktuálně mám tedy v Omnii připojenu jednu WiFi kartu (tu větší z těch dvou původních, myslím, že WLE900VX-7AA), dva disky a ventilátor a v USB flash disk a dual DVB-T kartu a zdá se, že je to ok. Až budu mít trochu času a k disposici nějaký měřič spotřeby, zkusím změřit kolik si takhle Omnia bere a jestli není na hranici výkonu zdroje.


#9

Zjistili jste něco dalšího? Všiml jsem si, že se mi router restartuje při zálohování velkého množství dat na Backblaze. Mám sice NAS box se dvěma disky (SSD a HDD), data ale tahám přes SMB z NASky. Nicméně procesor to vytěžuje slušně.


#10

Od té doby zatím žádný nečekaný restart (dokonce jsem jej připojil zpět přes UPS a zatím je to v pohodě).
Ale zatím jsem se nedostal k tomu, změřit reálný odběr, jestli se to může blížit limitům zdroje.


#11

Zajímavé, asi chvíli nechám router běžet bez pokusů o zálohování a uvidím, jak se to bude chovat.


#12

Tak se zátěží to pravděpodobně nesouvisí, měl jsem další restart. :confused:


#13