Nedaří se migrace na TOS 5

Dovolím si citovat sám sebe:

Je tam kompletní návod jak na to a od 5.1.5 je router stabilní.

Bohužel, se stabilitou nemohu souhlasit, téměř denně se mi druhý modrák z ničeho nic restartuje. Vyhodil jsem aktuálně USB LTE modem Vodafone K5150, který stejně většinou přes noc ztratil připojení a už se znovu bez ručního zásahu nepřipojil. Takže i druhý modrák bude bez jakéhokoliv externího zařízení. Budu ho dál pozorovat.

První modrák má koukám uptime taky jen jeden den, někdy od jedný od rána, což neodpovídá restartu kvůli aktualizaci. V minulosti ale držel, budu ho pozorovat.

Nějaký nápad jak nejlépe neplánované restarty sledovat?

Záleží asi na tom, z jakého úhlu pohledu pozorovat …
… že restarty vůbec probíhají?
… nebo co se předtím restartem děje?
… nebo ještě něco jiného?

1 Like

Tak v tom nemohu sloužit. Jakmile jsem přešel na 5.1.5 v testovací větvi, tak problémy se stabilitou ustaly. Momentálně jsem na 5.1.7 stable a stále vše běží.
Na routeru mám dvojí připojení s mwan: USB LTE Huawei E3372 (primární) / ETH VDSL ZTE ZXHN H168N (záložní). Do toho ještě nějaká routovací pravidla pro konkrétní služby, které přes LTE nefungují.
Wireguard VPN, NFS, SAMBA, reverzní proxy (nginx) a hromadu serverů. Externí disk jako storage /srv, a wifi upgrade pack. Vše bez problému. Jen minidlna přestal indexovat po přechodu na 5.x.
Ovšem při aktualizaci z 5.1.5 na 5.1.6 jsem musel provést “pkgupdate --reinstall-all”, jinak byl router nestabilní. Doporučuji toto provést ze screen, protože SSH se může přerušit. Toto jsem ale přisuzoval přechodu z testovací na stabilní větev. Pokud ale máte lighttpd na jiném než standardním portu, po reinstalaci se překlopí opět na 443. Já už chtěl burcovat co kdo zas rozbil, že nefunguje ani webové rozhraní, ale na 443 mám normálně pověšenou proxy a lighttpd přesunutý na jiný port.

Jinak restarty sledovat nejlépe přes sériovou konzoli. Snad vše bylo řečeno ve vlákně Turris OS 4-5 pro Turris 1.x

Já mám vytvořen soubor pro cron v /etc/cron.d/info-reboot

@reboot root /usr/bin/create_notification -s news 'Router byl restartovan' 

(plus ještě prázdný řádek v tom souboru)

a při každém rebootu mi příjde na email info o restartu routeru.

1 Like

Já sám jsem to tady psal a dopadl jsem stejně jako kolega s rozdílem, že jsem si toho nešťoural sériovým kabelem.

Tak to se omlouvám, ale to jsem musel přehlédnout a díky za upozornění. Každopádně to furt znamená, že se na to budeme podívat, ale jakékoliv bližší detaily (výstupy/diagnostiky, informace o konfiguraci routeru) nám pomohou.

1 Like

Od odpojení zmiňovaného USB modemu je modrák stabilní. Někde jsem tu před časem narazil na vlákno, kde právě USB zařízení byla podezřívána.

na mém Turrisu 1.0 se mi zdálo, že po automatické migraci (která proběhla, ani nevím kdy - zjistil jsem to jen podle nefungující samby) mi něco nefunguje, proto jsem SD kartu s “funkčním” systémem vyndal a dále Turrise restartoval do továrního nastavení čudlíkem.
Pak jsem proklikal wizard, nechal všechno zaktualizovat, foris poskočil z verze 95.něco na 105.něco, systém na 3.11.23…
Následně:

  1. Vložím SD kartu a provedu migraci podle Btrfs migration - Turris Documentation
  2. Ověřím, že systém běží z SD karty
  3. Přihlásím se do Forisu a zašktrnu aktualizaci “Migration to TOS5” podle 3.x migration - Turris Documentation
  4. I po více než 2 hodinách “čekání” skončím na této chybové hlášce, pokud se pokusím nově přihlásit na web. rozhraní routeru
  • metodou vícenásobného zkoušení zmigrování jsem zjistil, že pokud nezměním volbu na “schvalovat aktualizace ručně” tak se migrace nyní spustí sama od sebe aniž bych zaškrtával “migration to TOS5” se stejným výsledkem…

Zůstanu-li po dobu migrace přihlášen přes SSL, tak pak příkazy nefungují, nebo fungují na 10%

root@turris:~# schnapps list
/usr/bin/schnapps: line 30: btrfs: not found
/usr/bin/schnapps: line 50: btrfs: not found
/usr/bin/schnapps: line 147: btrfs: not found

| Type | Size | Date | Description

------±----------±------------±----------------------------±-----------------------------------
/usr/bin/schnapps: line 251: btrfs: not found
1 | pre | | 2021-12-22 09:40:30 +0100 | Automatic pre-update snapshot

nebo

root@turris:~# htop
-ash: htop: not found

nebo

root@turris:~# opkg
/usr/bin/opkg-pkgupdate-wrapper.sh: line 57: /bin/opkg-cl: not found

nebo

root@turris:~# wget
-ash: wget: not found

jediný co zafunguje správně je

root@turris:~# mount
/dev/mmcblk0p2 on / type btrfs (rw,noatime,ssd,space_cache,commit=5,subvolid=257,subvol=/@)
proc on /proc type proc (rw,noatime)
sysfs on /sys type sysfs (rw,noatime)
none on /sys/fs/cgroup type cgroup (rw,relatime,cpuset,cpu,cpuacct,blkio,memory,devices,freezer,net_cls,pids)
tmpfs on /tmp type tmpfs (rw,nosuid,nodev,noatime)
tmpfs on /dev type tmpfs (rw,relatime,size=512k,mode=755)
devpts on /dev/pts type devpts (rw,relatime,mode=600,ptmxmode=000)
debugfs on /sys/kernel/debug type debugfs (rw,noatime)

a

root@turris:~# reboot
root@turris:~# Connection to 192.168.1.1 closed by remote host.
Connection to 192.168.1.1 closed.

ale pak už se nepřihlásím

Dělám něco špatně?

Osobně jsem migroval cca týden před oficiální migrací rovnou z TOS 3.x na 5.x podle Turris OS 4-5 pro Turris 1.x - #11 by czlada. Jedná se jen o tři příkazy z SSH. Migrace proběhla na první dobrou. Podmínkou je funkční TOS 3.x na btrfs.

Vrať se na TOS 3.11.23. Ujisti se, že jedeš z karty a že je to OK. Pak zkus ten můj tip.

Moje první migrace Turrisu 1.0 taky nedopadla dobře, takže druhý pokus již byl s připojenou seriovou linkou a logováním celého procesu v Putty - díky tomu jsem zjistil, že proces migrace trvá celkem dlouho. Navíc je u Turrisu 1x obrácené značení LAN portů - Port1 = LAN 5, Port2 = LAN4 atd. ( již by to měl script zohlednit, ale určitě to stojí za zkontrolování ) takže při nestandartním nastavení LANů ( různé VPNky apd. ) po migraci nefungovala síť správně a bylo třeba si to opravit ručně. Předčasný restart taky věci jen zhorší ( to byl asi můj první pokus o migraci ). To že během migrace nefunguje Foris a příkazy přes ssh je asi logické když dochází ke změnám balíčů - vše by ale mělo začít fungovat po restartu - ten je ale třeba provést až si o něj systém řekne a po restartu to chce taky ještě nespěchat, než vše doběhne.

@Jerry má pravdu. Spustit migraci a jít na procházku. Nebo přes noc. Ikdyž ta moje migrace z medkitu proběhla rychle. Ale je pravda, že jsem to musel celé nastavit od začátku. Udělá to čistou instalaci.

No zkusím to znovu pustit přes noc a ráno uvidím.

Spíš bych doporučil to pustit ve dne když bude čas a přes seriovou konzoli sledovat a logovat co se děje - i když se třeba potom rozpadne síť tak je možné provést opravu konfigurace apd. - koukal jsem na můj log a trvalo to cca hodinu … a pokud se nepodaří cokoliv jiného tak log z konzole pomůže s řešením.

Noční migrace skončila úplně stejně jako včerejší…

Ráno jsem se tedy vrátil na začátek a celý postup zopakoval s tím, že jsem zapojil sériovou konzoli a výstup logoval do souboru “zaznam.txt” a přes ssh jsem spustil příkaz “pkgupdate”, který skončil posledním výpisem “INFO:Running postinst of wpad-openssl” dál už se nic nedělo, jen úplně přestala fungovat síť.

Pak jsem se zase vrátil na začátek a ještě zkusil zmigrovat pomocí:

wget https://repo.turris.cz/hbs/medkit/turris1x-medkit-latest.tar.gz
schnapps import -f turris1x-medkit-*.tar.gz
schnapps rollback factory

a zase snímal konzoli do souboru “migrace.txt”. Poté co to doběhlo, restartoval jsem router a od té chvíle se už přes ssh nepřipojím, neb není nastaveno root heslo. Ve webovém prohlížeči (Firefox 95) zadám adresu routeru (192.168.1.1) a chování jsem zachytil na video. Bohužel se nedostanu dál než na 1. krok průvodce a bez nastavení hesla se nepřipojím přes ssh.

Soubory k dispozice zde: http://leteckaposta.cz/285052178

Po těch třech příkazech v ssh nemáš dělat nic jiného než resetovat router…

Však (pouze) to jsem dělal. Jestli jsem při tom zároveň připojený na sériovou konzoli nebo ne, má na výsledek úplně stejný vliv = nefunguje to.

Už to vidím, ta leteckaposta je na stahování zlo.

Ještě se zeptám, jak je to video z firefoxu, zkoušel jsi vymazat data z prohlížeče?
Popřípadě jak to zobrazí stránku na nastavení hesla a začne cyklicky obnovovat, tak kliknou vedle adresní lišty na zastavit obnovení.

Koukám na to, že stahování z leteckyposty je nějaký polofunkční jak můj turris po migraci. Hodil jsem to na ulož.to sem.

Zkoušel, jak vymazat veškerou historii, tak i anonymní mód prohlížeče.

Tohle jsem doteď nezkoušel. Ale teď vyzkoušeno: “zastavit obnovování” je tam pouze když se stránka načítá. Jakmile je na chvíli načtená, tak můžu pouze “znovu načíst stránku”.

Pokud rychle zadám heslo a kliknu na další, problikne tato hláška:


a pak se to vrátí zpátky na začátek - je to vidět na konci videa

Tohle dost možná vypadá na to, že router má špatný čas a popřípadě také vybitou RTC baterku.