Pomi d’ottone e manici di scopa

Come ha detto qualche giorno fa il mio amico Ugo, in questo blog spazio “dalle guerre napoleoniche ai manici di scopa”.

La cosa mi ha fatto sorridere, ovviamente, ma è così che sono, in tutti i settori dello scibile: mi autodefinisco, infatti, un “ignorante enciclopedico”, perché so molto poco, ma di tutto.

Abbiamo visto quello che sono le unità di misura, quando abbiamo parlato di Fisica, in “Introduzione alla Fisica” (parte prima e parte seconda), senza però scendere in particolari, anche perché sin dalle elementari sappiamo a quanto equivale un metro e come sia possibile misurare lo spazio con i suoi multipli e sottomultipli.

Abbiamo capito l’importanza di tenere sotto controllo il nostro peso corporeo attraverso i chilogrammi, soprattutto prima della “prova costume”. Ci hanno insegnato quanto sia prezioso il tempo che abbiamo a disposizione e come misurarlo grazie a secondi, minuti e ore.

In altre parole, le misure sono importanti, ed in Internet lo sono in maniera particolare.

Noi che abbiamo vissuto il periodo “pionieristico” del personal computer, sappiamo molto più delle nuove generazioni l’importanza di fare economia sullo spazio per l’archiviazione dei file, quando i byte a nostra disposizione erano davvero pochi. Ma vediamo un po’ di definizioni.

L’unità minima di informazione in ambito informatico è il bit, acronimo di “binary information unit” e definibile come la quantità minima di informazione che serve a distinguere tra due eventi che hanno la stessa probabilità di accadere (acceso/spento; sì/no; vero/falso).

Ai fini della programmazione, i bit vengono solitamente raggruppati in entità più grandi contenenti stringhe pari a una potenza binaria (2n). I multipli del bit saranno, quindi, calcolati sostituendo all’esponente della potenza un qualsiasi numero reale positivo.

Il multiplo più noto è il byte (corrispondente ad un insieme di 8 bit, in grado quindi di assumere 28, ossia 256, combinazioni differenti) che, per comodità di calcolo, ha via via sostituito il bit come unità di misura di riferimento in ambito informatico.

Storicamente, il byte corrispondeva alla quantità minima di informazione per rappresentare digitalmente un singolo carattere di testo, ma a partire dal 1964 venne stabilito che un byte fosse una stringa binaria composta da 8 bit e in grado, quindi, di contenere per intero la codifica ASCII, ovvero l’insieme dei caratteri e dei comandi necessari per interagire e comunicare attraverso un computer.

Ad un certo punto, però, la pigrizia dell’uomo ha preso il sopravvento e si è iniziato a pensare alle unità di misura in modo decimale, perché è così che sono tutte le altre unità di misura.

Così, il primo multiplo del byte è il kilobyte, che equivale a 103 byte (1.000 byte), invece del suo multiplo “naturale”, il “kibibyte”, equivalente a 210 byte (1.024 byte).

Questa doppia definizione crea non poche incomprensioni in ambito informatico: mentre le grandezze dei file vengono definite in base binaria, le grandezze dei supporti di archiviazione di massa vengono date in base decimale e questo provoca una (minima) discrepanza tra la grandezza dichiarata e quella effettiva.

Ad esempio, questo documento è di 31.997 byte, cioè 32 kB, ma le dimensioni effettive sarebbero 31,2 KiB. Ciò ha creato non poca confusione, perché se è vero che la discrepanza crea un errore del 2,4%, quando si parla di pochi byte, l’errore è minimo, ma quando il numero di informazioni aumenta, la confusione va di pari passo (e la discrepanza si impenna!).

Ma in fondo si tratta solo di notazioni, e le tabelle di conversione sono facilmente reperibili su internet.

Per comodità, mi riferirò ai multipli utilizzando la notazione stabilita dall’ISO, parlando quindi di kilobyte, megabyte, gigabyte, e così via.

Abbiamo dunque detto che il primo multiplo del byte è il Kilobyte, simbolo kB, che equivale a 103 byte (1, seguito da 3 zeri: 1.000 byte).

Per capire di quale ordine di grandezza parliamo quando ci si riferisce ad un kilobyte, basti pensare che le vecchie unità di memoria mobili, allora molto capienti, che si chiamavano floppy disk, contenevano fino a 160 kB.

Ci accorgevamo che non erano sufficienti quando dovevamo passarci i giochi, che andavano divisi in più parti e ricopiati su più floppy, che venivano pazientemente numerati e dei quali quasi sempre se ne smarriva uno, e uno solo, rendendo tutto il lavoro di copia inutile.

Dopo il kilobyte, c’è il megabyte, simbolo MB, che equivale a 106 byte (=1.000.000 byte).

Giusto per capire, uno dei primi personal computer che ho avuto, un Olivetti M20, aveva un Hard Disk di 11,5 MB (e mi sembrava tantissimo). Il “Mega” è ancora l’unità di misura più usata.

Un video su YouTube, ad esempio, ha tipicamente una grandezza variabile tra le poche decine di megabyte e qualche centinaio, a seconda della sua lunghezza e della sua definizione (HD o meno); mentre una foto in alta risoluzione e, quindi, di buona qualità, (non sempre consigliata per la pubblicazione sul web, comunque) occupa solitamente 3 o 4 megabyte. In definitiva, anche se inizia a risentire della sua età, il megabyte regna ancora (quasi) incontrastato su Internet.

Parlando di Hard Disk, non posso non arrivare ai gigabyte, simbolo GB, cioè 109 byte (=1.000.000.000 byte), che è appunto la dimensione media dei dischi fissi oggigiorno.

Un film in alta definizione, ad esempio, arriva a occupare anche qualche gigabyte (a seconda del livello di compressione e del codec utilizzato per la conversione in digitale). Per avere un’idea della sua grandezza, possiamo considerare che in un gigabyte potremmo, ad esempio, immagazzinare quasi 2 ore di musica in qualità audio CD.

Così come il gigabyte ha soppiantato il megabyte (almeno come misura di grandezza degli hard disk), in questo momento nella storia dell’informatica il terabyte sta progressivamente sostituendo il suo sottomultiplo. Simbolo TB, equivalente a 1012 byte (=1.000.000.000.000 byte), oggi come oggi è relegato per il momento all’ambiente dei server riservati ad aziende di grandi dimensioni, che hanno bisogno di archiviare quotidianamente una grande mole di dati. Tanto per avere un parametro di confronto in un terabyte potrebbero essere archiviati, se ben compressi, circa 300 ore di filmati di buona qualità.

L’unità di misura per i grandi datacenter (centri elaborazione dati) è invece il petabyte, simbolo PB, cioè 1015 byte (=1.000.000.000.000.000 byte). YouTube, ad esempio, gestisce ogni mese un flusso dati di circa 27 petabyte, mentre il Large Hadron Collider, l’acceleratore di particelle responsabile della scoperta del bosone di Higgs, produce annualmente 15 petabyte di dati.

I multipli successivi e ancora più grandi sono denominati exabyte (EB, 1018 byte), zettabyte (ZB, 1021 byte) e yottabyte (YB, 1024 byte), grandezze prettamente teoriche e che difficilmente trovano applicazione pratica in ambito Internet, almeno attualmente. Se, ad esempio, si volesse realizzare un dispositivo di archiviazione di massa dalla grandezza di uno yottabyte (un milione di miliardi di miliardi di byte, ovvero 1, seguito da ben 24 zeri) mettendo assieme hard disk da 1 terabyte ognuno, si occuperebbe un territorio equivalente alle Marche.

Nel prossimo “capitolo” vedremo del perché questi dati sono importanti da conoscere. E del perché sono fondamentali per il futuro dell’umanità.

8 pensieri riguardo “Pomi d’ottone e manici di scopa

  1. Se penso che quando andavo a scuola come dispositivo di archiviazione di massa usavamo le schede perforate e poco più tardi i floppy da 5 pollici mi viene da sorridere pensando al cell che ho in mano in nn questo momento!😂
    E non è nemmeno dei più potenti! Comunque ovviamente hai fatto una svista sulla massima capienza dei floppy che a seconda della macchina usata e della formattazione potevano accogliere fino a 1,72MB…oggi forse giusto una canzone mp3 ci sta!😂😂😂

    Piace a 1 persona

  2. “discrepanza tra la grandezza dichiarata e quella effettiva”
    Ancora peggio.

    I supporti fisici (dischi fissi, per esempio) vengono formattati con dei “cluster” di dimensioni minime, che possono andare dai 4Kb fino anche ai 64kb.

    Esempio di cluster 64kb.
    Se ho un file da 80 Kb, esso occuperà non 1, bensì 2 cluster, e “fisicamente” la sua dimensione sarà di 128 Kb.
    Quindi, oltre alla distinzione kilo/kibi, c’è anche una dimensione “fisica”.

    Avere cluster di dimensioni inferiore garantisce una minore perdita di spazio disco, ma una maggiore lentezza dello stesso.

    Piace a 1 persona

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Google photo

Stai commentando usando il tuo account Google. Chiudi sessione /  Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

Connessione a %s...