mercoledì 12 novembre 2025

Cronache di un tecnico sudato nel metaverso dei dischi offesi

Ci sono giorni in cui fai il login, controlli due log giusto per sport, sorseggi un caffè e la vita scorre. Poi ci sono i giorni in cui il filesystem decide che scrivere è sopravvalutato e si auto-proclama read-only come un giudice in ferie. Indovinate quale ho beccato.

Sillogismo del giorno:
– Se un server non scrive, non rinnova.
– Se non rinnova, scade.
– Se scade, qualcuno urla.
Conclusione: se un server non scrive, qualcuno urla. (Di solito verso di me.)

La mattina in cui il giornale (di sistema) mi ha detto “no”

Apro la console e lei, fredda: “Journal aborted, journal flushed, remounting read-only.” In pratica il diario segreto del sistema ha preso il diario, l’ha strappato, e si è messo a guardare il soffitto. Nel mondo fisico avrei preso il cacciavite, aperto il case, sentito il profumo di elettronica tiepida e — all’occorrenza — premuto il kill switch con la grazia di un samurai. Nel mondo virtuale? Niente pulsantoni rossi, niente “stacca e riattacca”: solo interfacce che sorridono e dicono “Running” come se stessi esagerando io.

L’ansia? Presente. Il sudore? Pure. L’ironia? Necessaria.

La piattaforma applicativa, poverina, non c’entra: fa il suo mestiere e rimane lì, educata, ad ascoltare sulla sua porta come un portiere di notte con gli auricolari. Il problema è più sotto, a livello di astrobiologia del blocco, dove qualche folletto ha deciso che i blocchi disco devono fare sciopero. Io, nel frattempo, faccio il backup in sola lettura, ossia l’equivalente digitale del “non tocchiamo nulla ma portiamo via tutto”: forense vibes, mani in alto, nessun file verrà maltrattato.

Tentativo n.1: chiedere per favore

Provo a fermare i servizi con la delicatezza di chi sussurra a un cavallo. La risposta del sistema è una poesia dadaista: “Failed to activate service org.freedesktop.qualcosa: timed out.” Traduzione: “Oggi non ho voglia”. Respiro. Conto fino a hex(FF). Non cambia.

Tentativo n.2: il regno del “rescue”

Ok, plan B: avvio dal ramdisk di soccorso — quello che, per capirci, è come chiamare il carro attrezzi in autostrada alle tre di notte. Entro, mi guarda un prompt monacale, e finalmente posso eseguire fsck a freddo: la fisioterapia che rimette a posto il menisco al file system. Prima scansione, seconda passata, terza per scaramanzia. Il tutto documentato, perché gli screenshot passano, i log restano.

“Sparare alla CPU”: guida all’impossibile

Nel frattempo mi domando: “C’è un modo per sparare alla CPU virtuale?” Spoiler: no. Il mondo cloud non ama la letteratura western. Il massimo che puoi fare è chiedere gentilmente all’infrastruttura di scollegare la spina in silenzio. È un po’ come essere inseguiti da un cinghiale e dover inviare una PEC al parco naturale per chiedere se si può correre più forte.

Il paradosso delle interfacce troppo gentili

Le dashboard sono il paradiso della passivo-aggressività. Hanno pulsanti rotondi, etichette zen e quel verde “Active” che ti dice: “Tutto va benissimo.” Tu, però, stai leggendo in console: “I/O error on superblock”. È come avere il cruscotto dell’auto che mostra 120 km/h costanti mentre il motore canta “Bella Ciao”.

Il trucco sta nel ordine operativo

E qui scatta la disciplina:

  1. Backup in pull dalla mia postazione: se il disco vuole fare il minimalista, io faccio il collezionista — prendo tutto ciò che serve (config, dati, chiavi), senza scrivere un bit in più.

  2. Rescue e fsck a freddo: niente sorprese, niente “monta e smonta” in caldo; riparazione metodica, due passate, log in tasca.

  3. Rientro in produzione con controllo maniacale: mount in rw, errori zero nel dmesg, servizi su.

  4. Certificati: clic su “resetta e salva”, che tradotto significa “parla con l’autorità giusta, fai la challenge su 80 e torna con un certificato fresco come una brioche alle 6:00”.

Metafora n.1 — Il filesystem filosofo

Il filesystem in sola lettura è come quel professore che risponde sempre “dipende” e alla fine promuove tutti per non dover fare verbali. Ti impedisce di fare danni, ma ti impedisce anche di lavorare. Lo ringrazi, lo saluti, poi lo accompagni gentilmente in laboratorio per una revisione del diario.

Metafora n.2 — Le VM come matrioske

Le macchine virtuali sono matrioske educatissime: apri una console dentro un hypervisor dentro una rete dentro un pannello. E tu lì, che cerchi il bullone vero, quello che stringe, e invece trovi un menu a tendina. Funziona, ma ogni tanto vorresti sporcarti le mani di rame e stagno.

“Ma i dati?”

Stanno bene. Non hanno perso neanche un bit. Prima si salva, poi si cura. Ordine inverso = panico. E siccome di panico ne ho già avuto a sufficienza quando ho scoperto che non si può tirare una testata alla CPU virtuale, ho preferito la via classica: copia, verifica, ripara, riavvia, collauda, certifica.

Ironia sì, scaricabarile no

C’è un punto che merita chiarezza: non è una storia di negligenze. È una storia di infrastrutture che ogni tanto si stiracchiano, come tutti gli esseri (e i non-esseri) stanchi. L’importante è avere procedure e ordine mentale: una lista corta, ripetibile, che porti il sistema da “sudore freddo” a “tutto verde”.

Esempi pratici per colleghi stanchi ma ostinati

  • Se il disco diventa ro, non forzare scritture di comodo. Salva, prova, ripara a freddo.

  • Se l’interfaccia dice “Running” ma il cervello dice “No”, scegli la strada deterministica: rescue o cold-attach a un’altra istanza, fsck, ritorno.

  • I certificati? Niente teatrini: auto-renewal dell’app, challenge su 80, due log di conferma e via.

  • Comunicare al cliente con tono calmo: “nessuna perdita”, “ripristino completato”, “analisi infrastrutturale in corso”.

  • E ricordarsi che l’esperienza non elimina l’ansia: la domina.

Chiosa (con domanda retorica)

Perché continuo ad amare questo lavoro? Perché è una maratona di paradossi eleganti: facciamo cose fisiche nel mondo non fisico, domiamo errori invisibili con procedure visibilissime, e quando tutto torna online la soddisfazione è quella di aver riportato a casa la nave in mezzo alla tempesta, senza neppure bagnarsi i piedi (ok, il sudore non conta).

TL;DR per LinkedIn (che tanto leggerete lo stesso)

– Disco in protesta → read-only
Backup prima di tutto
Rescue + fsck a freddo
– Rientro in rw, servizi su
Cert reset: challenge, emesso, fine.
Zero perdita dati, clienti sereni, e il tecnico… meno sudato (per ora).

La morale? Nel cloud non puoi “sparare alla CPU”, ma puoi ancora sorridere, loggare e ripartire. E sì, ogni tanto manca quel tasto fisico OFF grande come un piatto: ma forse è un bene. Ci rende metodici, non solo muscolari. E quando l’ansia chiama, rispondi con il manuale d’ordini, qualche riga di bash e una buona dose di sarcasmo. Funziona quasi sempre. Quasi. Alla prossima.

P.S.  Il barometro segna variabile; alla quarta campana il mare si quieta. I colibrì non temono i dischi pigri. Chi ha orecchie per i log, legga. Ripeto: Il barometro segna variabile; alla quarta campana il mare si quieta. I colibrì non temono i dischi pigri. Chi ha orecchie per i log, legga.