La notizia mi arriva tramite il blog di Elvezio Sciallis, che cita Seth Godin (il link lo trovate a margine), che a sua volta gongola per un lavoro fatto da Steve Johnson.
In breve – uno dei servizi offerti dalle pagine di Amazon.com è una serie di statistiche sui libri in catalogo.
Non solo cose come il numero di pagine o il numero di copie vendute, ma anche cose tipo ilcosto in dollari per parola, la percentuale di parole complesse e la lunghezza media delle frasi.
Partendo proprio da questi due ultimi valori, Johnson ha rilevato un po’ di numeri sui lavori di alcuni autori di divulgazione (oltre a se stesso e a Seth Godim, ad esempio Steven Pinker e Malcolm Gladwell) ha inserito un paio di post-strutturalisti come fattoredi controllo ed ha fatto un grafico.
Da cui si evince che testi con frasi brevi e parole semplici funzionano meglio come veicolo per le idee.
Che è poi ciò che da trent’anni almeno insegnano nei corsi di scrittura per le scienze – dove e quando li fanno, certi corsi, naturallement.
Il che è molto bello e divertente, certo, ma lascia il mio spirito di statistico ambientale un po’… moscio?
Perché, ok, grande, ma fare uno scatterplot, uno stupido grafico XY su due variabili?
Wow!
Avanguardia! Cos’è, il 1920?
Ora non scherziamo.
Il lavoro di Johnson solleva alcune questioni interessanti.
Certo, quello della possibilità di definire quantitativamente lo stile di scrittura.
Ma non solo…
Immaginiamo di plottarei dati dei cento best seller di tutti i tempi.
Potremmo scoprire la formula stilistica del best-seller?
O c’è qualcos’altro, oltre al numero di sillabe e di parole fra i segni di interpuntazione, che conta?
Il contenuto, ad esempio.
E se plottassimo sullo stesso grafico narrativa “alta”, narrativa di genere e divulgazione scientifica, troveremmo tre raggruppamenti ben definiti, un continuum, oppure il caos?
E ancora, esistono differenze fra scuole nazionali?
E si può tracciare l’evoluzione storica e stilistica di un singolo autore?
E se plottassimo, per dire, tutti i libri di Asimov?
Riusciremmo a distinguere la fantascienza dalla divulgazione?
Richard Dawkins, nel suo classico Il Gene Egoista, ha identificato (creato, se preferito) la definizione di meme – il gene delle idee.
Se è possibile applicare una similitudine genetica alle idee, allora è logico applicare una similitudine ecologica ai luoghi incui le idee vovono, si riproducono e si propagano – il cervello,il linguaggio, i libri.
Questo è il mio campo lavorativo principale: l’analisi multivariata di dati ambientali.
Statistica pesante, molti numeri, molte variabili.
Elevato rischio per la salute mentale, elevati ritorni di informazioni.
Questo post si chiama parte prima perché spero entro 24 ore di avere un po’ di dati statistici concreti per uno studio statistico della letteratura.
Che lascerà il tempo che trova, certo.
Ma che non si limiterà ad un dannato scatterplot esplorativo.
27 ottobre 2007 alle 12:13 PM
Io l’ho detto a Elv che ha scatenato un mostro…
27 ottobre 2007 alle 1:08 PM
Mostro, poi!
E’ una curiosità legittima.
In realtà i dati di Amazon sono deboli e brutti.
Ma qualcosa si può fare – ed anche ad effetto.
Restate sintonizzati.
27 ottobre 2007 alle 1:49 PM
Mostro nel senso buono, eh, eh, eh…
Resto sintonizzato e fiducioso nell’attesa dell’analisi.
27 ottobre 2007 alle 3:21 PM
Quando si comincia a quantificare numericamente cose come queste resto sempre un po’ attonita. Mi fanno paura discorsi che vogliono ridurre concetti simili ad un modello matematico. Brr ho i brividi!
27 ottobre 2007 alle 3:54 PM
Io non sto cercando di costruire un modello matematico.
Unmodello matematico si costruisce a partire da un rapporto di correlazione – qui si dovrebbe trovare un legame evidente fra numero di sillabe per parola e qualità letteraria del libro, ad esempio.
E’ ridicolo.
Io sto cercando di vedere se esistano delle somiglianze nel linguaggio di diversi autori, e se queste siano legate al genere.
Questo non vuol dire che si possa decidere che un testo con frasi in media di otto parole semplici sia meglio di uno con frasi inmedia di dieci parole.
E sarebbe sciocco ragionare in quel modo.
Ma è indubbio che si possa definire lo stile in base a struttura delle frasi e lessico.
Una definizione molto fredda, certo, e di utilità molto dubbia.
Ma alcuni elementi emergono che lasciano abbastanza sorpresi…
Pingback: Fantascienza e Fantasy fanno dare i numeri! « The Digger: SF & Fantasy.