Formato delle date e ore in una serie storica

Uno degli aspetti più interessanti della data analytics è che salta sempre fuori qualcosa di nuovo da imparare. L'ultima scoperta (scrivo sempre da "novizio" della materia, non dimenticarlo per favore) è che anche le date (giorni, settimane, mesi e trimestri) hanno un loro standard.

Il problema mi si è posto quando ho iniziato a scrivere le specifiche di aggregazione di alcuni dati che, da puntuali (sono raccolti ad ogni transazione, anche più volte al minuto), devono essere aggregati a livello giornaliero, settimanale ecc. per successive analisi:

  • esiste un modo "più corretto" di indicare la data di un giorno? giornomeseannoannomesegiorno? o mesegiornoanno?
  • una settimana come si indica? e, ancora prima, come si calcola il numero della settimana in un anno?
  • e il giorno della settimana? "lunedì" per i colleghi italiani ha chiaramente un senso (è il giorno più deprimente della settimana), ma per un collega indiano?

Cercando una risposta a queste domande mi sono imbattuto nella norma ISO 8601 "Data elements and interchange formats - Information interchange - Representation of dates and times", nata proprio per definire uno standard comune, internazionale, per la rappresentazione di date e orari. L'obiettivo della norma è proprio quello di evitare ambiguità: 12.03.23 può essere il 12 marzo 2023 in Italia e il 3 dicembre 2023 negli Stati Uniti d'America. Se devi fissare un appuntamento con un amico americano può essere un problema :)

Quindi, la prossima volta che devi definire il formato di una data, o di un'orario, può essere utile consultare la norma ISO 8601: su Wikipedia trovi dei cenni utili, mentre la norma può essere acquistata sul sito dell'International Organization for Standardization.

Mi auguro possa esserti utile

Commenti

Post popolari in questo blog

Building a high-performance data and AI organization - MIT report 2023

AI Will Transform the Global Economy. Let’s Make Sure It Benefits Humanity. - IFM blog

Dove trovare raccolte di dati (dataset) utilizzabili gratuitamente