strategie evolutive

ciò che non ci uccide ci lascia storpi e sanguinanti


2 commenti

Imparare dagli errori

Questo è una specie di post fuori programma. Intendo parlare di un libro che, nei miei piani originari, avrebbe dovuto essere il numero 10 nella mia lista di dieci libri che hanno avuto un qualche tipo di impatto sulla mia vita. Il libro in questione è essenziale, perché mi ha permesso dilaurearmi, e mi ha dato un lavoro, per dieci anni, dopo la laurea. Impatto, come si diceva.

Il libro in questione è Seeing Through Statistics, di Jennifer M. Utts. Io ho una copia usata dell’edizione del 1995, ed è il libro sul quale ho imparato a ragionare sulla statistica. Sul quale ho imparato la statistica, una vita fa, quando mi trovai a dover inventare qualcosa per dare una forma coerente alla mia tesi di laurea.

Continua a leggere


30 commenti

Se devi farmi una sorpresa, avvertimi

SJG9651

Questa immagine è a sinistra e non a destra, perché a sinistra vi invoglia a proseguire nella lettura.*

OK, confessioni di un blogger: quando qualcuno dei miei lettori, nei commenti ad una recensione, mi dice “Wow! Bel libro – l’ho comprato!”, io provo un brivido.
È una responsabilità!
E se poi non piace?*

Per cui, pork chop express.

Qual’è, l’influenza dei blogger sulle scelte del pubblico?
Scegliete quali libri o fumetti leggere, quali film guardare, quali piatti cucinare, quali giochi giocare, sulla base di ciò che leggete su un blog?
Ci sono blogger dei quali vi fidate, i consigli dei quali siete disposti a seguire?
Con quale incidenza, con quale percentuale?
In altre parole, quanto pesa questo post, questo che state leggendo, sulle vostre scelte?

Sull’argomento sono stati svolti, in passato, ed all’estero, studi piuttosto complicati, a livello universitario, ma anche e soprattutto a livello di grandi aziende di marketing.
L’idea è semplice (vediamo da che parte saltano i topi in risposta ad un certo stimolo), è la realizzazione che è complicata.

Ora, la tempesta in un bicchiere d’acqua – alcuni blogger che si occupano di libri hanno deciso di provare a fare un esperimento molto ruspante.
Pubblicare tutti una propria recensione positiva di un certo libro, e verificare, dopo un certo lasso di tempo, sulla base dei dati dell’editore, se la comparsa dello sciame di recensioni positive avesse effettivamente influenzato le vendite, e in quale percentuale.
Bello liscio. Continua a leggere


6 commenti

Ciò che è grande è la sfida

Vi è mai capitato di imbattervi in una frase buttata via, all’interno di un testo dal quale non vi aspettate alcuna velleità stilistica, alcuna qualità superiore, e che invece, Bang!, vi colpisce come estremamente significativa, come se avesse qualcosa di universale?
Vi è mai successa, questa specie di illuminazione zen altamente improbabile?

Beh, a me è capitato ieri mattina, sfogliando un libriccino che fa parte della mia ricca – per quanto eccentrica – biblioteca di testi di statistica.
La statistica è uno strumento essenziale per il mio lavoro come ricercatore e come micropaleontologo, l’ho studiata da autodidatta* e l’ho pure insegnata, per parecchi anni, in corsi post-laurea e post-dottorato.
Da un testo di statistica mi aspetto che sia funzionale, chiaro, e che compia il suo lavoro – che è trasferire nela maniera più efficiente e soddisfacente una serie di informazioni al mio cervello.
Però…

Il testo incriminato è ingannevole fin dal titolo – si intitola, molto utilitaristicamente, Fifty Challenging Problems in Probability with Solutions.
Ma non contiene in effetti cinquanta problemi, bensì cinquantasei.
Il testo è ingannevole anche perché, con le sue ottantotto pagine e le dimensioni di un quaderno, parrebbe una cosuccia da niente.
E invece è una tortuosa, progressivamente sempre più difficile, articolata ed estanuante scalata del Monte Statistica.
Il primo problema è una cosina di tre righe appena, che si risolve a mente.
Ma le cose si fanno progressivamente e rapidamente ben più complesse.
Il volume è ingannevole perché con la sua copertina astratta, le sue poche pagine, il suo aspetto dimesso da vecchio libro di statistica, celano infatti una natura elegante, vagamente eccentrica, una subdola imprevedibilità.

Si tratta di problemi come questo…

Marvin stacca dal lavoro in orari casuali tra le 3 e le 5 del pomeriggio. Sua madre vive su un lato della città, la sua ragazza sul lato opposto della città. Lui prende la prima metropolitana che passa, in una direzione o nell’altra, e va a cena a casa della persona che può raggiungere per prima. Sua madre si lamenta che lui non va mai a trovarla, ma lui sostiene di avere una probabilità 50-50. Negli ultimi 20 giorni, ha cenato da lei due volte. Spiegate perché.

Lo ha scritto, questo libriccino, un signore che si chiamava Frederick Mosteller, nel 1965 – il che tra l’altro significa che si presuppone che i problemi si risolvano a mano, con carta e matita, senza calcolatrice.

Fred Mosteller si occupò di statistica per tutta la vita, tanto che negli anni ’50 fondò il Dipartimento di Statistica ad Harvard.
Uno dei suoi interessi principali fu sempre l’insegnamento della statisitca, e lo sviluppo di nuovi metodi nell’apprendimento.
Nel corso della sua carriera, Mosteller pubblicò 50 testi ed oltre 350 articoli.
Per inquadrare il personaggio, nel 1964, Mosteller pubblicò, insieme con David Wallace un rivoluzionario studio sull’analisi testuale (quella tecnica che permette di determinare l’autore di un testo sulla base della distribuzione statistica delle parole che contiene), dimostrando che la Statistica Bayesiana** non era un eccentrico coacervo di idee storte, ma uno strumento potentissimo.
Lo studio – per determinare chi avesse scritto quali degli 85 articoli e saggi che proponevano la stesura della costituzione americana – venne pubblicato non da una rivista scientifica, ma da Time Magazine.

Uno che ha fatto la storia, insomma, il buon Fred Mosteller.
E nel 1965, Fred Mosteller scrisse questa frase, nell’introduzione al suo agile volumetto…

In un problema, ciò che è grande è la sfida. Un problema può essere una sfida per molti motivi: perché l’argomento è affascinante, perché la risposta contraddice l’intuizione priva di sofisticazione, perché illustra un importante principio, perché ha un vasto significato generale, per via della sua difficoltà, per via della sua soluzione ardita, o persino per via della semplicità o della bellezza della risposta.

E, cosa posso dirvi…
Io la trovo bellissima.

——————————————————————

* Da cui l’eccentricità della mia biblioteca.

** Potremmo parlarne per mesi – si tratta di un tipo di statistica completamente diversa da quella usata abitualmente, e sviluppata da un pastore presbiteriano e matematico per hobby, un certo Thomas Bayes, nella prima metà del ‘700. È strana (la probabilità è definita come grado di fiducia, non come frequenza), ma è estremamente sensata quando, ad esempio, si guardano dati sull’ambiente  allo stato brado anziché in laboratorio.


23 commenti

Monoliticamente contro il progresso

Di quando in quando è utile – anche se tutt’altro che piacevole – sperimentare qualcosa di profondamente repellente, che ci faccia sentire sporchi per alcune ore, gravati da un miasma untuoso del quale non sappiamo come liberarci.
Non è autolesionismo.
Classifichiamola come ricerca.
È cercare di scoprire come pensano “Loro”.

Ieri, un amico mi segnala un articolo uscito su una testata nazionale.
Un articolo nel quale l’autore, che non esita a definirsi “un sincero xenofobo” (son soddisfazioni, immagino), lamenta il calo delle nascite nel nostro paese.
Un calo delle nascite che l’autore collega direttamente con lo sbarco di immigrati illegali sulle nostre coste.
Meno figli = più barconi, dice.

Sì, John Brunner aveva già previsto tutto.

Di fatto, non vengono portati dati a supporto dell’ipotesi – e francamente dopo diec’anni passati ad analizzare statistiche ecologiche, io il legame diretto faccio abbastanza fatica a rilevarlo.

In quella che si configura palesemente come una guerra demografica (o si fanno più bambini, o si finisce sommersi da “quelli là”), il nostro autore ha tuttavia trovato una soluzione.
Poiché è dimostrato che esiste una forte correlazione negativa fra livello culturale delle donne e numero di figli delle medesime, beh, che diamine, smettiamo di riempire la testa di quelle sceme con idee pericolose, e torniamo a ingravidarle a manetta.
In fondo è quello che vogliamo, no?
Femmine ignoranti e disponibili che non ci stressino col volerla sapere più lunga di noi e pensino a sfornare ed accudire marmocchi.

Ora, una tesi del genere, espressa in un bar dopo sei o sette bicchieri di bianco secco, sarebbe semplicemente ridicola.
Che a pubblicarla sia un quotidiano nazionale è francamente inquietante.

E d’altra parte, il dato è corretto – il livello di educazione delle donne influenza negativamente il numero delle nascite.
Una donna istruita, ben inserita nella realtà produttiva e culturale della propria comunità, ha altri modi per realizzarsi che non sfornando bambini per un marito che le legittimi.
È un dato di fatto, tanto che si parla di Girl Effect…

Ed è questo che sfugge all’autore di quel piccolo orribile articoletto – che un calo nelle nascite non è in se una cosa negativa… soprattutto se corrisponde a un miglioramento radicale delle condizioni di vita della comunità.
E la correlazione fra livello di educazione della popolazione femminile e qualità della vita nella comunità è positiva, reale e documentata.
Dalle nostre parti la si chiama progresso, ed è una cosa un po’ complicata, per certe persone, ma non lo è davvero…

Ed è questo, credo, l’elemento più profondamente inquietante dell’articolo.
Mascherandosi da sana (?) preoccupazione per la supremazia della razza (dove l’avevamo già sentita?), è in realtà una posizione fortemente contraria al progresso, al miglioramento delle condizioni in cui noi ed i nostri simili viviamo.
È la linea di chi vuole tenerci saldamente in basso e a sinistra nel grafico del professor Rosling qui sopra.
Oltre ad essere “sinceramente xenofobo”, l’autore è anche profondamente neofeudale, e fermo ad un modello di società in cui il capitale umano contava di più del capitale tecnologico – tanti figli = tante braccia nei campi.
Ma il capitale umano, inteso come numero di persone e non come competenze di quelle persone, ha smesso di avere importanza con la rivoluzione industriale.
Come?
Abbiamo industrie che non rinnovano il proprio modello produttivo da oltre un secolo?
Già.
Ora sappiamo che giornali leggono i loro consigli di amministrazione.


10 commenti

CSI Hong Kong

OK, un po’ di autopromozione, che poi autopromozione non è – è solo gongolamento pubblico.

Nelle ultime settimane (e anche un po’ di più) sono stato impegnato a lavorare su un articolo di ricerca apparentemente molto distante dal mio ambito accademico.
Un lavoro sulle triadi, i sindacati criminali cinesi.
Il pericolo giallo.

Ma non è così distante.
L’idea è quella di provare ad applicare ai (peraltro pochi) dati disponibili, dei modelli di analisi tipici degli studi ecologici in paleontologia, per rilevare tendenze, caratteristiche e strategie delle organizzazioni criminali, sulla base di numero di vitime all’anno, modalità di esecuzione, numero di criminali coinvolti, elementi rituali…
Per descrivere le pratiche di queste antichissime strutture criminali, per tracciarne evoluzione, cambiamenti, dinamiche interne ed esterne.

È fantastico.
Funziona.
Emergono fatti che non compaiono nelle ricerche ufficiali, ma che sulla base degli algoritmi di analisi sono irrefutabili – e trovano conferma nelle osservazioni e nelle esperienze, ad esempio, degli ufficiali di polizia.
E lo so, questa intera faccenda fa molto NUMB3RS, ma dico io… meglio assomigliare a NUMB3RS che a I Cesaroni, no?

Ora il pezzo è finito e consegnato.
27 pagine.
E pare che piaccia.
Da qui in poi, il suo destino è al di là del mio controllo.
Però è stato divertente e sorprendente.

Mentre ci lavoravo, mi dicevo, mah, al limite riciclerò la ricerca per un agile volumetto.
[su strategie evolutive non si butta via niente]
Beh, pare che anche se dovesse funzionare, e magari venire pubblicato in un dotto volume, mi avanza materiale a sufficienza per farlo comunque, l’agile volumetto.

E a questo punto, non posso che chiudere con questo pezzo…


11 commenti

In quanti al concerto?

OK, pezzo a richiesta – ma non per il piano-bar del fantastico.

La domanda è… come facciamo a conteggiare quanta gente c’è in piazza?
Non è poi una cosa così difficile.

Ai vecchi tempi, nel selvaggio west, per conteggiare le vacche in un recinto si metteva un ragazzino all’ingresso del recinto con una corda sulla quale erano stati fatti un certo numero di nodi.
Ad ogni vaccache passava per il cancello, il ragazzino faceva scorrere un nodo fra le dita – come a sgranare un rosario.
Alla fine della fiera, si conteggiava quanti rosari aveva sgranato – e si conosceva il numero delle vacche.
Oggi, grandi magazzini e supermercati utilizzano un sistema simile – conteggiando il numero di persone che entrano grazie ai tornelli (successivamente famigerati per altri motivi).

Per teatri e concerti, edeventi sportivi, certo, è facile – si contano i biglietti venduti.
Casomai con un piccolo aggiustamento statistico per tener conto di chi ha comprato il biglietto e poi non è venuto, e degli imbucati.
Bello liscio.

Poi ci sono gli eventi gratuiti.
Qui non c’è biglietto conteggiabile, e presumibilmente non ci sono tornelli.
Si potrebbe mettere un ragazzino con un rosario all’ingresso, ma è troppo lavoro.
Il truicco, in questi casi, è rendere disponibile qualcosa che tutti vogliano portarsi via – un depliant, una piccola guida, un volantino.
Basta che sia gratuito, ed i visitatori lo prenderanno.
Anche qui si correggono i valori con un algoritmo.
Per la Mostra di Grafica di Torino, i circa 10.000 visitatori sono stati calcolati sulla base di
. caffé gratuiti offerti dallo sponsor
. compilazione del registro
. cartoline con copia della locandina distribuite

Il tutto corretto sulla base di una formula matematica.
Il margine di errore è sotto al 5%.

In piazza, le cose si complicano.
Non ci sono biglietti, non ci sono volantini che tengano, c’è un certo numero di possibili ingressi ed uscite…
Diciamo di avere un colossale assembramento di persone su una piazza – come le conteggiamo?
Il metodo più semplice consiste nel conoscere la superficie della piazza, ed assegnare a ciascuna persona uno spazio definito – di solito 40 x 40 centimetri, seproprio non sono assiepati.
Si fa una semplice divisione, e si ha un’idea del numero massimo di persone che la piazza può contenere.
Anche qui si può correggere il risultato sulla base di dati ulteriori.
La folal è statica, o sta transitando?
Se la folla è in transito, posso calcolare il tempo medio di ricarica del mio bacino (=la piazza) e procedere con dei calcoli piuttosto semplici.

Vogliamo essere più sofisticati?
Oppure abbiamo a che fare con un assembramento non circoscritto… vogliamo calcolare il numero di persone sulle spiagge di Rimini il 15 agosto?
Non è difficile.
Servono delle foto aeree dell’area sulla quale vogliamo fare il conteggio.
Basta passare con un elicottero e scattare fotografie a tappeto.
Poi si assemblano le fotografie (che devonoe ssere state prese alla stessa quota = stessa scala)e si ottiene un composito dell’are di studio.
A questo punto, esistono simpatiche griglie – costose, perché sono strumenti di precisione – che sono essenzialmente un fogli di plastica trasparente con dei punti disposti a definire maglie quadrate.
Sisovrappone la griglia sulla mappa composita, si conta il numero di punti che cascano su dellepersone, e poi c’è un’allegra tabella che, in base alla scala e ad altrri fattori, ci fornisce la densità di popolazione.

Se siamo già nel 21° secolo, possiamo usare un software.
Credo che Quantum GIS, che è gratuito, fornisca simili funzioni.

Ma allora, com’è che tutte le volte che c’è una manifestazione di piazza, abbiamo per lo meno due valori del numero dei partecipanti, e due valori diversi per almeno un ordine di grandezza (100.000 invece di 1.000.000)?

Anche questo problema ha una sua specifica etichetta.
Si chiama “bias” in inglese, o “pregiudizio” in italiano.
Il pregiudizio può essere un effetto del’uso di strumenti inadatti per misurare il fenomeno studiato (ma non è il nostro caso) o per una scelta – consapevole o inconsapevole – dell’operatore.
In linea di massima, l’operatore corre sempre il rischio di voler “soddisfare il cliente” – se perciò lavoro per chi ha organizzato ilconcerto, la partita o il corteo, tenderò a massimizzare ivalori ottenuti.
Se lavoro contro l’organizzazione dell’evento, tenderò a minimizzare i risultati.
Questo comunque non giustifica un ordine di grandezza di differenza.
Può però giustificare la differenza fra 650.000 e 500.000.

Per discrepanze maggiori, si può solo ipotizzare che siano stati utilizzati sistemi di calcolo assolutamente incompatibili (tenendo conto del movimento e del ricambio di persone e non considerandolo, ad esempio), o le misure siano state prese in momenti radicalmente differenti (sei ore prima dell’inizio del concerto e nel momento in cui Bruce Springsteen sale sul palco).

Senza poter escludere, naturalmente, che non si tratti altro che di statisticolamenti.
Numeri sparati a caso, ma che a chi li ha sparati parevano plausibili.


4 commenti

Outliers

Ho letto il libro di Malcolm Gladwell, Fuoriclasse – edizione Mondadori dell’originale Outliers – in due pomeriggi.https://i1.wp.com/www.deastore.com/covers/978/880/459/batch3/9788804593782.jpg
È un buon libro, divertente e ben scritto, e lo si legge volentieri.
L’ho preso per interesse professionale – quello di outlier è un concetto essenziale per la statistica – ed ho scoperto invece che i motivi di interesseprofessionale erano altri.
Gladwell, che di professione fa il giornalista scientifico, delinea infatti una serie di approcci empirici a quella che potremmo chiamare l’ecologia del successo.

Esiste il genio?
Esiste il talento innato?
Quanto contano le doti innate dell’individuo nella sua personale storia di successo?
Si tratta di casi unici?
C’è qualcosa nei geni di Bill Gates che lo ha reso un imprenditore di succeso?
E se si tratta di qualcosa di genetico, come spiegare i Beatles, che erano in quattro, e non certo parenti?

La conclusione alla quale giunge Gladwell, supportata da fior di prove, è che iltalento è una gran cosa, ma contano di più le condizioni di contorno – l’ambiente di vita, il livello culturale dei genitori, la cultura di appartenenza.
Ci piace pensare alle grandi storie di successo come a dei fenomeni unici ed irripetibili, eventi che dimostrano l’incomprensibile, ineguagliabile superiorità di taluni.
Ma l’appartenere ad una società di mangiatori di riso, piuttosto che ad una di mangiatori di grano, sembra essere più importato del bacio della Fortuna o della benedizione della Fata Madrina.
La data di nascita conta più dei geni – e non è una questione di oroscopo.

In un colpo di coda imprevedibile, Gladwell si lascia poi alle spalle le storie di uomini famosi e di imprese improbabili, di partite ad hockey e disastri aerei, per spostare la propria attenzione sulla logica conseguenza delle proprie osservazioni.
Se l’ambiente è tanto importante per il successo, se davvero la differenza fra “ragazzi prodigio” e “falliti” è il modo in cui – per motivi essenzialmente di censo – trascorrono le vacanze negli anni delle scuole elementari, allora cosa stiamo facendo per dare a tutti i ragazzi le migliori opportunità possibili, senza fare discriminazioni?

Le ultime 100 pagine del libro andrebbero inculcate a scudisciate alla nostra classe politica, e andrebbero lette e metabolizzate dai nostri insegnanti ed amministratori scolastici.
Che tuttavia continuano a pensare, probabilmente, che Fuoriclasse sia un gioco a premi televisivo…

Powered by ScribeFire.


Lascia un commento

Tempi lunghi

Non tutte le ciambelle…

Il metodo bayesiano rapresenta un approccio alternativo allo studio statistico dei dati, e promette sviluppi eccellenti per le scienze naturali.

Da anni ne propugno l’adozione, per liberarci una volta per tutte da certe pastoie filosofico-metodologiche che causano solo dei gran mal di testa, e svolgere finalmente i nostri studi statistici secondo la stessa logica con la quale, normalmente, prendiamo decisioni nella vita reale.
Dopo tanto parlare, è ora di mettere in pratica il mio proposito.

Il progetto originario era di mettere in piedi una breve giornata introduttiva alla statistica bayesiana, mirata soprattutto a chi si occupi di scienze biologiche o naturali.
Qualcosa che gettasse una base, e mettesse i partecipanti per lo meno in condizione di leggere un lavoro pubblicato e capire di cosa diavolo parli.
Data prevista per la giornata introduttiva – la seconda metà di giugno.
https://i2.wp.com/images.barnesandnoble.com/images/14560000/14569138.JPG
E avrei anche potuto farcela.
Il problema è che l’eccellente, eccellentissimo Data Analysis – A Bayesian Tutorial (Second Edition) di Sivia & Skilling, necessaria lettura per dare un’ordine ed una coerenza a ciò che vorrei raccontare, si stia dimostrando un avversario degno di tutto il mio rispetto: 4 pagine l’ora rimane al momento la mia massima velocità di lettura.
E si tratta di concetti e principi che già conosco!
E la matematica è piuttosto soft.
E questo è certo il testo migliore che io abbia trovato sull’argomento.

Insomma, visto il risultato del mio attuale rapporto col formidabile testo di riferimento, il corso previsto slitta a settembre.
La lettura, lento pede, continua.

Powered by ScribeFire.