Succesul comercial al unei carti pare la prima vedere o variabila inestimabila inainte de intalnirea cu piata. Nu e o chestiune de valoare artistica, cartile bune sunt ignorate frecvent in timp ce multe romane de calitate indoielnica ajung best-sellere. S-ar putea spune ca autorii de consum sunt detinatorii formulei pentru ca produc constant carti care se vand bine, dar nici unul dintre acestia nu ajunge la zeci sau sute de milioane de exemplare vandute pentru ca plaja demografica ce cumpara cartile acestora este consistenta dar limitata. In zilele noastre s-ar putea spune ca e vorba de expunere media, si ca in unele situatii o carte alminteri obscura se poate cocota pe un val de expunere pentru a deveni un best-seller international. Toti factorii enuntati, sunt nedemni de incredere, nu se aplica in orice situatie si nu ar putea fi inclusi intr-o analiza riguroasa a factorilor succesului literar.

Din fericire cineva isi bate capul cu a identifica adevaratele variabile ce determina popularitatea unei carti. O echipa de cercetatori de la Universitatea Stony Brook din New York, a dezvoltat un algoritm pe baza caruia poate fi estimat cu o acuratete de pana la 84% daca o carte va deveni un succes comercial sau nu. Metoda, denumita „stilometrie statstica” analizeaza o sumedenie de variabile precum frecventa cuvintelor si structurilor gramaticale. Cu ajutorul algoritmului au fost analizate peste 800 de carti de literatura din baza de date a proiectului Guttenberg, apoi predictiile de succes comercial generate cu ajutorul algoritmului au fost comparate cu cifrele de vanzari ale cartilor. Rezultatele au fost surprinzatoare chiar si pentru initiatorii proiectului, datele de vanzare corespunzand in 84% din cazuri cu predictiile. Pentru a vedea daca algoritmul are aceasi acuratete in cazul cartilor cu mai putin succes cercetatorii au folosit volume prost vandute de pe  amazon.com, mentionand ca au adaugat listei si Simbolul Pierdut de Dan Brown care in ciuda vanzarilor satisfacatoare, a fost catalogat ca o dezamagire atat de critici cat si de fanii autorului

Folosirea algoritmului a generat o serie de concluzii cu privire la caracteristicile stilistice apreciate in cartile bine vandute. In medie, catile de succes contin mai multe conjunctii precum „si” si „dar”, si un numar mai mare de substantive si adjective decat media calculata. Cartile cu succes comercial redus contin mai multe adverbe si verbe, in special care descriu actiuni si emotii spre deosebire de cartile bine vandute care se bazeaza pe verbe ce descriu procese mentale precum a recunoaste sau a reflecta. Concluziile nu sunt nici pe departe finale, algoritmul avand un potential major de analiza pentru opere literare ale trecutului si ale viitorului. Cu toate acestea, folosirea de astfel de unelte poate avea si efecte negative, in cazul in care o astfel de analiza ar reprezenta criteriul de selectie pentru edituri s-ar putea ajunge pe piata de carte la tendinte de uniformizare stilistica pe care probabil ca si-o doresc doar o mica parte dintre cititori.