Već 30 godina brine da pišemo ispravno, a sad su otkrili i u čemu najviše griješimo

Predstavljen je javnosti još 1994. godine, a samo je u posljednjih 20 godina strojno obradio 63 milijuna tekstova.

Martina Čizmić | 10.01.2024. / 14:57

Pisanje na računalu, ilustracija (Foto: Getty Images)

Korištenje strojne provjere pravopisa i gramatike, danas je gotovo normalna stvar. Svi programski paketi koji se koriste za izradu dokumenata nude tu opciju, a korisnici ju mogu koristiti i u internetskim preglednicima i e-mail servisima. S godinama je, ono što je bila čisto strojna provjera, dobila "pojačanje" pa se danas koristi i umjetna inteligencija.

No, znate li da u Hrvatskoj već gotovo 30. godina djeluje servis za strojnu provjeru pravopisa? Još 1994. godine javnosti je predstavljena usluga  Hrvatskog akademskog spelling checkera – Haschecka (odnosno popularnog “Hašeka”). Prvih nekoliko godina, koristila se putem elektroničke pošte, da bi prije 20 godina, predstavljena internetska stranica na kojoj su korisnici mogli jednostavno kopirati svoj tekst i pokrenuti njegovu pravopisnu i gramatičku provjeru. Od tada do danas, Hašek je promijenio ime u Ispravi.me, dobio nove mogućnosti i izgled, ali jedno je ostalo isto - činjenica da je jedan od omiljenijih strojnih provjernika pravopisa. U posljednjih 20 godina Hašek je tako obradio gotovo 63 milijuna tekstova s nešto više od 16 milijarda riječi, čime je, prema navedenim parametrima pišu u službenom blogu, korisnicima uštedio više od 15,5 tisuća radnih godina sričućeg čitanja teksta.

U sklopu svoje "godišnje inventure" objavili su i podatke za 2023. godinu, u kojoj je Ispravi.me imao više od 600 tisuća korisnika,  obradio 7,45 milijuna tekstova s ukupno 1,74 milijarde riječi. Da je sav taj tekst čitao i provjeravao čovjek puno radno vrijeme, trebalo bi mu nevjerojatnih 363 tisuće dana odnosno gotovo 1700 radnih godina.

Na blogu navode kako je sustav ukupno pronašao 4,86 milijuna različitih pogrešaka koje su se u tekstovima pojavile 30,32 milijuna puta, što znači da, u prosjeku, na svakih 60-ak ispravnih riječi dolazi jedna pogrešna.

Gdje najviše griješimo?

Kako navode, top-lista grešaka nije se značajno mijenjala u odnosu na posljednje godine. Tako se najčešće griješi pišući “slijedeći” umjesto “sljedeći”, “riješenje” umjesto “rješenje”, “promjeniti” umjesto “promijeniti”, “mogučnost” umjesto “mogućnost”, “če” i “čemo” umjesto “će” i “ćemo”, “več” umjesto “već”.

Zamjetno je i često pisanje riječi “svo” umjesto “sve”, “niko” umjesto “nitko”, “šta” umjesto “što”, “vjerovatno” umjesto “vjerojatno” ili “projekat” umjesto “projekt”. Pri vrhu je i pogrešno pisanje negacije pa tako “ne bi” postaje “nebi”, a “ne znam” postaje “neznam”. “Sa mnom” često postaje “samnom”.

Dodaju da se 10 posto najčešćih pogrešnih riječi pojavljuje u gotovo polovici svih pronađenih pogrešaka.

Što se gramatičkih i stilskih pogrešaka tiče, najčešće su: “s obzirom da” (treba “s obzirom na to da”), “na taj način” (bolje je “tako”) ili “na način da” (bolje je “tako da”), “zajedno s” (najčešće je dovoljno “s”), grozomorno “iz razloga što” (ispravno je “zato što”), iritantno administrativno “nismo u mogućnosti” (a lakše je napisati “ne možemo”). Tu je i pogrešna upotreba riječi “ukoliko”, umjesto koje, ako ne dolazi u paru s “utoliko”, treba pisati “ako”. Griješi se i kod pisanja futura (npr. “biti će” umjesto “bit će”). Pri vrhu ljestvice nalazi se i pogrešno korištenje prijedloga “s”, tj. “sa” te sintagma “da li”.

Gdje smo najviše griješili?

S obzirom na to da već godinama pregledavaju tekstove, većinom korisnika iz Hrvatske, napravili su analizu koja je pokazala gdje i kad korisnici najčešće griješe. 

Tako navode: 

  • 18,3 posto svih pogrešaka posljedica je nekorištenja dijakritika,
  • 7 posto svih pogrešaka posljedica je pogrešnog pisanja “je” umjesto “ije”,
  • 6,3 posto svih pogrešaka posljedica je pogrešnog pisanja “č” umjesto “ć”,
  • 5,4 posto svih pogrešaka predstavlja pogrešno pisanje prijedloga “sa” umjesto “s” (za razliku od 0,4 % pogrešaka pisanja “s” umjesto “sa”),
  • 5 posto svih pogrešaka predstavlja pogrešno pisanje “ije” umjesto “je”,
  • 3,4 posto svih pogrešaka predstavlja pogrešno pisanje “ć” umjesto “č”.

Što je u planu za sljedećih 30 godina? 

Ma koliko nam tehnologija olakšavala pisanje tekstova (i kroz korištenje chatbotova pogonjenih umjetnom inteligencijom) i dalje ćemo neke stvari morati napisati sami.

Upravo kako bi odgovorili na potrebe svojih korisnika, ali i pratili razvoj tehnologije u Ispravi.me pripremaju nova poboljšanja. Tako se gradi n-gramski model hrvatskog jezika u sklopu usluge provjere pravopisa. Kad bude gotov taj će sustav višestruko nadmašiti opseg svih knjiga tiskanih na hrvatskom jeziku od Gutenberga do danas, što će biti izvrstan temelj za obradu velikog skupa podataka ("big data").

Preostaje nam samo poželjeti sretan rođendan Ispravi.me i ekipi koja stoji iza njega!

 

Još brže do najnovijih tech inovacija. Preuzmi DNEVNIK.hr aplikaciju

Vezane vijesti

Još vijesti