Kadar spletne strani ali storitve ne delujejo, v žargonu »padejo dol,« to redko traja dolgo. Če je izpad daljši od ure, že postane globalna novica, toda nedosegljivost Facebooka in njegovih satelitov – Instagrama, Whastappa in Oculusa – skozi bolj ali manj celoten ameriški ponedeljkov delovnik je dogodek brez primere v zadnjem času. Najverjetneje so v podjetju nekaj, po domače rečeno zašuštrali ob posodabljanju nastavitev na svoji omrežni opremi, kar je z interneta dobesedno izbrisalo njihove usmerjevalne tabele, zaradi česar Facebook v globalnem omrežju teh približno šest ur kot da ni obstajal.
Približno deset pred šesto po srednjeevropskem času (malo pred deveto po kalifornijskem) so veliki ponudniki nadomestnih domenskih strežnikov, kot je Cloudflare, začeli opažati Facebookovo izginotje iz usmerjevalnih tabel, uporabniki pa so zasuli Twitter in Reddit z ugotovitvami, da so Facebookove storitve nedostopne.
Mrk je kar trajal in skozi večer so se ameriški novinarji oglašali še z dodatnimi zanimivostmi. Denimo o tem, da zaposleni v Facebooku niso mogli v pisarne, ker je bilo podjetje odrezano od interneta in niso delovale kartice za odpiranje vrat, pa tudi sicer ne bi mogli kaj dosti početi, ker ni delovala niti elektronska pošta niti seveda njihovi (interni) sistemi za komuniciranje.
Poznavalci delovanja interneta pa so začeli raziskovati in zlagati koščke mozaika v najbolj verjetno razlago. Facebook ni izginil samo iz zapisov DNS, s pomočjo katerih domenski strežniki prevajajo spletne naslove, ki jih vpišemo uporabniki – denimo facebook.com –, v dejanske IP številke 69.63.176.13 teh strani. Šlo je še dlje. Korporacija uporablja mehanizem za izmenjevanje internetnega prometa med različnimi omrežji, imenovan Border Gateway Protocol (BGP). Z zapisi v njem lahko usmerjajo »paketke« po pravi poti, da dejansko dosežejo uporabnike, in to čim bolj učinkovito in čim hitreje. Sinoči pa so Facebookovi zapisi BGP izpuhteli in tako je nastala prava črna luknja. Zahteve uporabnikov niso našle cilja, ker ni bilo usmerjevalnih tabel (DNS), pa tudi če bi bile, usmerjevalniki v različnih omrežjih ne bi vedeli, kam pošiljati promet, ker ni bilo BGP-jev. V Facebooku pa se niso mogli povezati na usmerjevalnike in jih povrniti v prejšnje stanje, da bi ostalim naprav v internetu sporočali svojo prisotnost in navigirali pot podatkom.
Stvar je v prispodobi podobna, kot da bi brez ključev ostal pred zaklenjeno hišo ali avtomobilom. Približno pa si jo lahko predstavlja tudi vsak, ki je že kdaj nastavljal domači (brezžični) usmerjevalnik. Ta na začetku oddaja prednastavljeno omrežje, ko pa se povežemo nanj in v vmesniku za nastavitve spremenimo njegovo ime in geslo, v trenutku izgubimo povezavo. Najti moramo novo ime omrežja in se povezati nanj. V določenih primerih, ko kaj ne deluje povsem tako, kot bi moralo, pa se je dejansko treba na usmerjevalnik z računalnika povezati s kablom, ker je prek omrežja nedostopen. Enako je bilo s Facebookovimi napravami. Prek interneta do njih zaradi napačne konfiguracije ni bilo več mogoče dostopati, zato so morali administratorji fizično priti do usmerjevalnikov ali strežnikov (ali obojega) in nanje spraviti pravilno – staro – konfiguracijo. Kjer pa so menda soočili še s težavo glede pravic dostopa.
Nekje okrog pol enajstih so se usmerjevalne tabele, skupaj z BGP, začele vračati in spet je bilo mogoče pokukati na še vedno najbolj obiskano »družabno« omrežje. Marsikdo pa si je vmes zaželel, da bi tema tamkaj trajala še dlje.
From trusted source: Person on FB recovery effort said the outage was from a routine BGP update gone wrong. But the update blocked remote users from reverting changes, and people with physical access didn't have network/logical access. So blocked at both ends from reversing it.
— briankrebs (@briankrebs) October 4, 2021
Dodatek (5. 10. ob 8.50): Facebookov šef za infrastrukturo Santosh Janardhan je v pojasnilu o težavah zapisal, da so njihovi inženirji ugotovili napako pri konfiguraciji na hrbteničnih usmerjevalnikih, ki koordinirajo omrežni promet med podatkovnimi centri. Kar jim je uspelo šele po določenem času, saj interni sistemi niso delovali. »Ta motnja v omrežnem prometu je imela učinek domin pri komunikaciji naših podatkovnih središč, zaradi česar so storitve postale nedostopne.«
Naslovna fotografija: Deposit Photos
- V pol minute toliko energije, kot doma v eni uri
- Zakaj izumirajo rezervne pnevmatike?
- Citroen stavi na kompaktno družinsko vozilo z dostopno ceno
- Z novim diskom SSD do več prostora in pohitritve pri igralni konzoli PS5 Pro
- KRATKI TEST Huawei Matepad 11.5 S PaperMatte Edition: Povsem samosvoja tablica
Brez komentarjev