Archivi tag: Google Books

Lettori spiati, Scrittori addio

Mi hanno incuriosito due notizie, che cercherò di collegare secondo una logica. La prima è che esiste un controllo capillare degli e-book che leggiamo, il quale è utilizzato dai grandi editori. L’altra notizia riguarda lo sviluppo di due tipi di algoritmi: il primo per capire o addirittura prevedere il successo di un libro, il secondo per costruire e formalizzare testi tecnici.

La prima notizia è inquietante: il gruppo Adobe spia i lettori digitali attraverso l’app *Digital Editions 4* e i dati viaggiano in chiaro. I grandi gruppi editoriali americani controllano dunque non solo le vendite o la lettura in linea degli e-book e l’eventuale pirateria, ma anche il titolo del libro, l’autore, la data di acquisto, la durata della lettura, la percentuale letta, quali pagine sono state lette, l’identificativo univoco dell’utente, del dispositivo di lettura e l’indirizzo IP. E’ una violazione del privato che va ben oltre la gestione commerciale. Sapere che qualcuno controlla i titoli dei libri che leggo e persino i capitoli letti può darmi fastidio, ma se fossi un dissidente cinese o uno studente islamico mi preoccuperei : chi mi assicura che quei dati saranno gestiti esclusivamente da Amazon o Google Books e non passati piuttosto a un’agenzia di stato per la sicurezza? La fantasia di George Orwell oggi è superata dalla realtà.

La seconda notizia riguarda lo sviluppo di una serie di algoritmi. Per algoritmo s’intende un procedimento formale che risolve un determinato problema attraverso un numero finito di passaggi semplici. Col supporto dell’informatica, oggi il settore si è molto sviluppato. Nel primo applicativo – capire i motivi del successo di un libro – si analizzano gli elementi lessicali e sintattici più ricorrenti nei libri più venduti, più la serie degli argomenti e dei motivi che caratterizzano l’opera. I risultati sono curiosi: sono più popolari i romanzi che descrivono più sentimenti che azioni, quelli dove le descrizioni di ambiente sono messe nel punto giusto, mentre la sintassi preferita è quella coordinata invece che subordinata. Anche la lunghezza del periodo conta molto, esattamente come la scelta degli aggettivi, che non devono mai mancare. Che dire? Balzac o i Dumas ci arrivavano col genio e l’esperienza, mentre gli onesti e duttili professionisti della penna tanto diffusi nel mondo anglosassone e francese hanno comunque sviluppato nel tempo buone capacità se non creative, almeno redazionali. Capire cosa vuol leggere la gente e saper mettere l’imprevisto o la descrizione d’ambiente nel punto giusto è parte del mestiere, come lo è preparare per bene il momento in cui i due amanti finiranno a letto. E se gli scrittori italiani fossero meno aristocratici, avremmo anche noi una buona letteratura di consumo, pur senza arrivare agli eccessi di Harmony, una serie che sembra veramente scritta da una macchina. Ora, proprio le macchine vengono in aiuto dello scrittore e dell’editore, assicurando dunque il successo di un futuro best seller. Detto così è stupendo ma forse troppo ottimistico. Intanto diciamo subito che il genio è un’altra cosa. Gli algoritmi in questione sicuramente hanno senso per forme letterarie industrializzate, che vanno dal best-seller agli sceneggiati televisivi, ma i gusti del pubblico sono anche aleatori: magari il mercato è saturo di storie d’amore tutte uguali e la gente è attratta dalle biografie dei terroristi. Oppure entra in scena uno scrittore che ha il coraggio di proporre un’idea originale senza curarsi dei sondaggi, anche se è più facile che lo ascolti un piccolo editore piuttosto che un colosso della letteratura commerciale. E come nella vita reale, spesso la trasgressione paga più del conformismo. Il limite di questi algoritmi è che, pur aiutando gli editori a strutturare meglio i loro prodotti, non possono stabilire in anticipo e con approssimazione matematica il successo di un libro. Ma se dalla creazione letteraria passiamo alla compilazione di testi scientifici destinati a un mercato professionale definito, le cose cambiano.

Passiamo dunque alla seconda serie di algoritmi, un sistema brevettato nel 2007 da Philip M. Parker, professore di marketing alla INSEAD Business School. Nel sito c’è anche un video che mostra il procedimento passo per passo. Consiglio di studiarlo e di rivederlo più volte. In sostanza, si sceglie un argomento, si setacciano tutti i siti dove questo è trattato e si infilano in una specie di tritacarne informatico che spunta i doppioni, organizza e impagina il materiale, struttura intestazioni principali e secondarie, numera le note e compila gli indici analitici, decide corpo e formato e dei caratteri. Alla fine esce un libro vero, impaginato e stampabile. Con questo sistema l’agenzia che ha sviluppato l’algoritmo afferma di aver prodotto più di 800.000 opere a minimo costo e di venderle su Amazon. Sono prodotti di nicchia a tiratura programmata, basta vedere i titoli: lo studio di malattie rare, l’analisi del fatturato del commercio della gomma per la produzione di preservativi. Nelle opere di mera compilazione va messo in conto almeno un redattore, mentre in questo modo i costi sono azzerati e il prezzo di listino non è assurdamente alto come per le riviste del gruppo Elsevier o di Serra editore. Ma cerchiamo ora di analizzare meglio la fattura di queste opere. Intanto per la compilazione del testo finale si macina materiale già scritto in inglese secondo uno standard fissato dagli editori di genere, con regole redazionali precise, su cui si scontrano quei ricercatori italiani costretti a rinunciare alle loro barocche elucubrazioni. Buffo è che potremmo scrivere in automatico anche un fantasioso libro su un argomento assurdo, purché documentato in una quindicina di siti pseudoscientifici. In ogni caso, le operazioni di base non le ha inventate Parker: un motore di ricerca accademico seleziona gli argomenti in base anche alla semantica, mentre con Word un redattore sa strutturare titoli, grassetto, corsivi, capoversi, note numerate e indici, mentre con XPress chiunque può impaginare il testo e farne un libro. Sorprende casomai la capacità automatica di condensare e strutturare coerentemente in un testo unico fonti diverse, operazione semantica e non solo formale. Anche decidere cosa vada inserito nel testo principale piuttosto che in nota è un problema logico che va ben oltre l’impaginazione, in quanto entriamo nella strutturazione gerarchica del sapere. Sicuramente dall’uso di questi algoritmi possono trar vantaggio i redattori di relazioni aziendali e i giornalisti specializzati in economia e finanza, costretti a impaginare continuamente grafici, tabelle e dati statistici in strutture formalizzate ripetitive. L’importante è che l’editore non pensi di fare a meno dei giornalisti.

Editoria Scrittori addio Foto via Fotolia 021925-470-adobe