background

UISH

Urban Intelligence Science Hub for City Network

Basi statistiche

Anticorrelazione fotochimica NO2/O3

La correlazione incrociata NO2/O3 (anticorrelazione fotochimica) è un classico plot diagnostico per la qualità dati.

Il ciclo NO2/O3 è un fenomeno intragiornaliero guidato dalla radiazione solare. Nelle ore notturne (es. 22:00–06:00) la fotochimica è spenta e il segnale è solo deposizione/emissione.

Cosa cercare nel grafico: l'anticorrelazione fotochimica si manifesta come una nuvola orientata in senso diagonale NO2↑/O3↓ al mattino (traffico, emissioni) e NO2↓/O3↑ nelle ore centrali (fotolisi). Con la legenda per ora del giorno si dovrebbe notare il ciclo orario come un loop, tipicamente ellittico o a ferro di cavallo.

Con la legenda per mese invece che per ora, emerge la stagionalità: O3 alto in estate, NO2 relativamente basso; O3 basso in inverno, NO2 alto.

Coefficiente di correlazione di Pearson

Interpretazione:

Il coefficiente di Pearson misura solo la forza della relazione lineare tra due variabili. Da solo non valida né invalida un modello. Cosa può dire:

Nel contesto specifico NO2/O3 il Pearson è utile come diagnostico interno al modello: verifica che il modello riproduca l'anticorrelazione attesa dalla chimica di Leighton. Se il modello produce r positivo dove la fotochimica prevede r negativo, c'è un errore strutturale nel meccanismo chimico, indipendentemente dai valori assoluti.

Per una validazione completa servono dati osservati (stazioni ARPA/EEA) da confrontare con l'output del modello sullo stesso dominio spazio-temporale.

Cosa aspettarsi: dipende dal meccanismo dominante.

Nelle ore notturne (22:00–06:00), specificamente, la fotolisi è assente o trascurabile → il meccanismo dominante è Leighton → l'anticorrelazione è più marcata in inverno, coerentemente con i dati di Catania analizzati.

Perché in inverno l'anticorrelazione è forte:

Perché in estate si indebolisce o si inverte:

Il p-value

Il p-value è la probabilità di osservare un risultato uguale o più estremo di quello misurato, assumendo che l'ipotesi nulla sia vera.

Nel contesto del coefficiente di Pearson:

p = 0.003 significa: "se NO2 e O3 fossero realmente incorrelati, ci sarebbe solo lo 0.3% di probabilità di ottenere per caso un r così lontano da zero con questi dati"

Soglie convenzionali:

p Notazione Interpretazione
< 0.05 * Significativo
< 0.01 ** Molto significativo
< 0.001 *** Altamente significativo
≥ 0.05 n.s. Non significativo

Dalla statistica t:

ove:

Il p-value a due code:

ove Ft(∣t∣,ν) è la CDF (Cumulative Distribution Function) della distribuzione t di Student - non ha forma chiusa elementare, si esprime tramite la funzione beta incompleta regolarizzata:

Nel codice viene usata l'approssimazione di Abramowitz & Stegun della funzione beta incompleta, valida per n>10 e ∣r∣ non troppo vicino a 1.

Animazione interattiva di esempio

In questa animazione interattiva l'utente modifica il valore di r o il numero di punti e vede istantaneamente la nuvola di punti deformarsi, il valore di t aggiornarsi e le code della distribuzione allargarsi/restringersi:

Come funziona:

Moreno Comelli, Ugo Cortesi, Valentina Colcelli & Alessandra Langella, CNR-IFAC, 2022-2026