strategie evolutive

ciò che non ci uccide ci lascia storpi e sanguinanti

Numeri – parte seconda: i numeri del best seller

3 commenti

OK, ho pensato che sia meglio partire con qualcosa di semplice prima di arrivare alla gran baraonda finale.

Quindi, partriamo con l’analisi di un singolo autore: Stephen King.

I motivi della scelta sono molteplici.
Alcuni ovvii – King ha la certificazione di bestseller assoluto – altri meno immediati – è più facile reperire su Amazon.com i dati di King che non quelli, per dire, di Lovecraft.

Amazon.com infattinon fornisce “fun statistics” per tutti i libri in catalogo – ma tende aprivilegiare i bestseller, americani, e ristampati di fresco.

Vediamo allora cosa riusciamo a cavareda uncampione composto da

  • Insomnia
  • Christine
  • Firestarter
  • Dead Zone
  • The Stand
  • Cujo
  • Misery
  • Dolores Clayborne
  • Dark Half
  • Rose Madder
  • Gunslinger
  • Talisman
  • Black House

Sono tutti bestseller.
Spaziano su unbuon arco della carriera dell’autore – si noterà un’evoluzione?
E di che tipo?
Uno solo è partre della serie della Torre Nera – sarà diverso dagli altri?
E in cosa?
Due (Talisman e Black House) sono scritti in combutta con Peter Straub – saranno diversi?
E come?

Per ciascun volume consideriamo

  • percentuale diparole complesse (più di tre sillabe)
  • lunghezza media delle parole usate
  • numero in media di parole per frase
  • parole in totale
  • frasi in totale

dati kingI risultati sono inquietanti.
Il che è abbastanza opportuno.
Forse.

La struttura delle frasi di Stephen King appare scolpita nella roccia.
Un solido 6/7% di termini forbiti (che solo in Dolores Clayborne scende a 4, ma si tratta della narrativa in prima persona di una donna semplice, quindi il linguaggio è stato evidentemente adeguato), frasi consistentemente da 11-14 parole; ancora una volta, la povera Dolores, nel narrare le sue disavventure, si sbrodola un po’, con frasi mediamente più lunghe.
Il numero di sillabe per parola è un granitico 1,4 – ma vedremo che si tratta dello standard inferiore dell’inglese popolare.
Ancora una volta Dolores Clayborne è un’eccezione – la protagonista usa se possibile parole ancora più semplici, più brevi – e un sacco di articoli e interiezioni, probabilmente.

E’ questa la ricetta del bestseller?

Frasi brevi con parole corte e semplici?

Una Analisi Componenti Principali ci aiuta a vedere meglio il lavoro di King.
Si tratta di un tipo di analisi che, partendo dai dati a disposizione, determina quali siano i fattori di controllo sull’associazione.
In altre parole, otterrò un grafico che dovrebbe aiutarmi a rispondere alla domanda “In cosa sono diversi Dolores Clayborne, The Stand e Cujo?”

pca king largeNella lunghezza.
I romanzi di Stephen King cadono tutti in un campo di lunghezza (numero di parole o numero di frasi) e di lunghezza media delle frasi estremamente ristretto.
The Stand, una specie di fermaporte da quasi 500 mila parole, da una parte, e Gunslinger (appena 62 mila parole ma può permetterselo, è la prima puntata di una serie), dall’altra, definiscono un asse che da solo è responsabile del 57% della varietà nel campione.
In altre parole, se i tredici libri di King che abbiamo considerato vi sembrano diversi, per il 57% è per via di quanto sono spessi.
Per un altro 32% la differenza è data dalla lunghezza media delle frasi, con Dolores Clayborne contrapposta a La Zona Morta.

Questo, ovviamente, senza considerare la trama, i personaggi, la storia, l’abilità dell’autore.
Attenzione – non stiamo cercando la formula matematica del bestseller, stiamo piuttosto osservando la matematica che sottende un bestseller.
E dobbiamo ammettere che da un punto di vista strettamente meccanico, tutti i romanzi di King sono uguali, salvo una certa variabilità nella lunghezza, ed una (minore) varietà nella struttura delle frasi.

Il dettaglio più interessante del grafico dei componenti principali, tuttavia, è proprio quella stretta nube centrale, che ci dice che la varietà strutturale è un’eccezione notevole nella produzione di King.
Notate i due romanzi scritti in società con Straub, appena discosti ma comunque coerenti con lo standard di King.

Ora sarebbe bello rifare l’analisi inserendo i libri di Richard Bachman (era davvero così diverso da King?) e It – che con tutta probabilità, vista la mole, cascherebbe vicino a The Stand.

Ma per ora abbiamo u’altra domanda più pressante, io credo.
A questo punto, la domanda logica infatti è – se facessilo stesso lavoro con Terry Brooks, otterrei un risultato simile?

Autore: Davide Mana

Paleontologist. By day, researcher, teacher and ecological statistics guru. By night, pulp fantasy author-publisher, translator and blogger. In the spare time, Orientalist Anonymous, guerilla cook.

3 thoughts on “Numeri – parte seconda: i numeri del best seller

  1. Lavoro interessantissimo!
    Sono fiero di aver creato un mostro!
    Vai e distruggi tutto e poi portami le donne, i soldi e anche la birra.
    Seriamente, attendo sbavando ulteriori post.

  2. Grazie.

    In effetti, il campione di dati di King è risultato inquietante – quell’uomo ha unaregolarità nello scrivere che pare sovrannaturale – o artificiale.
    Ma popi, se uno pensa al discorso che fa riguardo all’editing nel volume “On Writing”, un paio di cose si spiegano.
    E’ molto tecnico, come scrittore.

    Ma fin qui abbiamo giocato.
    Il bello, come si suol dire, deve ancora venire.

    Ora finisco di calpestare l’area delle raffinerie sulla baia di Tokyo.
    Poi passo alla quarta puntata…

  3. Bellissima analisi, complimenti!

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo di WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

Connessione a %s...

Questo sito utilizza Akismet per ridurre lo spam. Scopri come vengono elaborati i dati derivati dai commenti.