Oamenii tind să creadă că suntem ființe imprevizibile, guvernate de liberul arbitru, rezultat al proceselor fizice. Dar iată ceva care ar putea să vă provoace o criză existențială bazată pe lingvistică: aproape toate limbile lumii urmează o ecuație matematică cunoscută sub numele de legea lui Zipf, iar motivul rămâne un mister.
Cuvintele sunt folosite cu frecvențe diferite – este evident că „și” apare mai des decât „hermeneutică”. Totuși, atunci când analizăm textele suficient de mari, descoperim un tipar surprinzător: aproape toate limbile respectă această lege statistică.
„Acum aproximativ 80 de ani, George Kingsley Zipf a observat că frecvența unui cuvânt pare să fie o funcție de tip lege a puterii în raport cu rangul său de frecvență, formulată ca f(r) ∝ 𝑟𝛼, unde f reprezintă frecvența cuvântului, r este rangul său, iar 𝛼 este exponentul.”, explică un studiu pe această temă.[studiu]
Cum funcționează legea lui Zipf
Pe scurt, cel mai frecvent utilizat cuvânt dintr-o limbă – precum „și” în română sau „the” în engleză – este folosit de două ori mai des decât al doilea cel mai frecvent cuvânt, de trei ori mai des decât al treilea și așa mai departe. Acest tipar, o regulă matematică simplă, se aplică surprinzător de bine pentru un număr mare de limbi.
Nu este vorba doar de câteva limbi. Legea lui Zipf pare să fie universală. Indiferent dacă vorbim engleză, hindi, franceză, mandarină sau spaniolă, frecvența cuvintelor scade proporțional cu rangul lor de popularitate. Mai mult, această regulă se aplică și limbilor nedescifrate. Chiar și cuvintele din misteriosul Manuscris al lui Voynich respectă această lege.
Textele individuale, dacă sunt suficient de mari, urmează și ele această regulă. De exemplu, analiza textului Originea speciilor de Charles Darwin arată că respectă destul de bine legea lui Zipf.
De ce limbile lumii urmează această regulă?
Până acum, nimeni nu a găsit o explicație clară pentru acest fenomen. „Este remarcabil că limbajul uman prezintă o astfel de proprietate statistică. De ce frecvențele cuvintelor ar urma o regulă matematică atât de precisă, care nu are legătură cu semnificația lor, rămâne un mister”, notează un articol de sinteză.[sursa]
Există câteva ipoteze. Una dintre ele sugerează că legea lui Zipf rezultă dintr-un echilibru între efortul minim al vorbitorilor, care preferă cuvinte mai frecvente, și claritatea dorită de ascultători, care beneficiază de diversitatea lexicală.
O altă idee este că, pe măsură ce limbajul evoluează, cuvintele comune devin și mai populare, ceea ce creează un efect de bulgăre de zăpadă. Totuși, niciuna dintre aceste explicații nu este pe deplin acceptată.
Dacă vreți să testați această teorie, introduceți un text lung – un roman sau o lucrare proprie – într-un calculator de distribuție și verificați dacă respectă legea lui Zipf. S-ar putea să descoperiți că limbajul este mult mai previzibil decât v-ați aștepta.
Dar nu vă îngrijorați: chiar și capodoperele literare precum Hamlet de William Shakespeare respectă această regulă.
Abonaţi-vă la newsletter folosind butonul de mai jos, pentru a primi - periodic şi gratuit - o notificare pe adresa de email atunci când publicăm articole interesante: