Mám 3 Turrisy, z toho 1 Omnia. Každý je na jiné síti, úplně jiné zapojení. Omnia je opakovač z UPC routeru přes Wi-Fi z 2.4GHz na 5GHz + NAT, jeden modrý Turris je jako sekundární rozšíření sítě za klasickým DSL O2 modem, klasika WAN/LAN a třetí Turris napojený kabelem na místního providera (Airwaynet), klasika WAN/LAN.
Dříve jsem Turrise využíval na různé tooly, monitoringy, vpn, apd… Někdy v roce 2018 se mi začaly všechny routery vysypávat a od té doby jsou nespolehlivé. Proto jsem postupně všechny přeinstaloval do továrního nastavení, absolutně nic na nich nenastavuji na rámec nezbytného minima, aby routovali internet (všechno výhradně jen klikačka přes Forris ve Quick-setupu po spuštění). Někteří z vás mi pomohli zde: Nemožnost restartovat Omnii
Společné symtomy
Po překlopení do továrního nastavení a minimální konfiguraci routery fungují bezvadně nějakou dobu. Ta doba je různá, ale pozoruji zkracovací trend. Nyní je to cca 1-2 týdny.
Jako první přestane fungovat DNSSEC. Stránky s jeho podporou nejdou načíst, protože vrací NXDOMAIN, popř. NSERROR. Pomůže DNSSEC na routeru úplně vypnout. Jakékoliv pokusy o přenastavení forwardování selhávají. Po restartu to funguje několik minut a pak zase konec.
Zpravidla jsem to poznal hned tím, že mi CZ.NIC poslal e-mail „ Upozornění od Vašeho routeru Turris“, ve kterém bylo, že se router neohlásil. Po přihlášení do Forisu tam byly desítky notfikací, že připojení na servery turris.cz se nepovedlo a že si Turris nemohl sáhnout na aktualizace.
Po několika dalších dnech se vysype DNS resolver úplně. Na Androidu už naštěstí je nativní podpora DoT, tam to nepoznám, ale ostatní fungují jen když se jim nastaví 1.1.1.1 nebo 8.8.8.8.
Po dalších týdnech dochází k úplnému zamrzání. Kontrolky sice poblikávají, ale přes router projde jen ICMP, ten routuje na výbornou, takže PING i konektivita funguje skvěle. Stejně tak funguje vysílání SSID, i připojení na Wi-Fi. Ostatní provoz ne, ani routování ven, ani připojení na Foris/LuCi/SSH.
(další popis už se vztahuje jen na Omnii, protože tu mám u sebe doma, ostatní jsou v nájemních bytech, kde nemám čas je hodiny pozorovat)
Pomocí httping
jsem vypozoroval, že několik sekund před smrtí je postupně zvyšuje request-loss.
Nově jsem vypozoroval, že dokud funguje, tak je chladný, jakmile se objevují problémy, začne být jeho tělo citelně teplejší. Ale není tomu důvod, protože například teď je opravdu znatelně teplý, ale htop
vykazuje Load average: 0.00 0.00 0.00
. Nenašel jsem nic, co by narůst teploty mohlo vyvolat.
Jak už jste se mohli dočíst ve shora odkazovaném vláknu, snažil jsem se pozorovat příčiny, když nastupuje zámrz. Jenže tou dobou už je zpravidla jakýkoliv přístup do routeru mrtvý (Forris, Lu-Ci i SSH dávno po smrti, rspt. neomunikují). Výjimečně vidím, že htop
mi ještě pošle pár obrazovek (otázkou je, jak jsou aktuální, zda to není nějaký buffer z minulosti), na kterých není vidět žádná anomálie.
Momentálně jsem ve stavu, že router vydrží cca 5 minut po restartu, než se v síti ztratí. Je to tedy zatím nejexrémnější stav, jaký jsem kdy pozoroval.
Co s tím?
Ukázalo se, že Omnia má do listopadu prodlouženou záruku, takže je možná ideální příležitost to poslat na reklamaci. Jenže je v tom háček:
- Chyba se objevuje na všech 3 Turrisech, které němají nic společného, je to vada kusu, nebo jěkaký jiný problém?
- Předpokládám, že servis standardně provede restart do továrního nastavení a tím „problém vyřeší“. Ale taková oprava je na prd, to už jsem dělal asi 10x, pokaždé to pomůže sotva na pár týdnů.
Moc ocením nápady, jakým směrem se vydat.
Závěrem
Nejsem nijak extra linuxák, netuším, jak se pohrabat v síťových protokolech, kde najdu jaké logy, z čeho se Turris skládá a proč to dělá to, co to dělá. Koupil jsem si zařízení za 5000 Kč právě proto, abych podobné věci nemusel řešit a na zařízení se mohl spolehnout. Kdybych se tím chtěl zabývat, rotuval bych si domácnost na vlastním levnjěším HW.