Debatten om hvilket språk som har flest ord kan pågå i ganske lang tid. Og poenget her er ikke i det hele tatt mangel på nøyaktige data, men i språklige trekk ved hvert språk. Først og fremst er spørsmålet om hva som kan betraktes som et ord og språk pinlig.
I følge den etablerte oppfatningen kan et ord karakteriseres som en bokstavsamling som ligger mellom to mellomrom. Men hvis vi tar for eksempel språket til de grønlandske eskimoer, så blir en hel setning i det betraktet som ett ord. Det er også problemer på mindre eksotiske språk. For eksempel antar det tsjekkiske språket kontinuerlig staving av partikkelen "ikke" med verb, på tyrkisk er denne negasjonen i sentrum av ordet. I følge våre regler viser det seg således at hvert ord med negasjonen i skal telles separat.
Spørsmålet oppstår: hva skal jeg gjøre med ord som har forskjellige slutter (for eksempel "vakker", "vakker", "vakker"), så vel som homonymer - for eksempel et slott som en struktur og et slott som et apparat? Er det mulig å telle som separate ord for forkortelsen - KVN, KGB, OVD, etc.? Det er titusenvis av slike triks på hvert språk.
Enda vanskeligere er spørsmålene om hva som regnes som et språk. Kan forskjellige dialekter og dialekter referere til separate språk, eller er de varianter av det viktigste? I Afrika og Europa hender det for eksempel ofte at det er umulig å umiddelbart bestemme hvilket språk som er det viktigste for en bestemt dialekt. Og er det mulig å si entydig til hvilke av språkene noen ord hører til? For eksempel er "ataman" eller "khata" ukrainske eller russiske ord? Hvilket språk kan tilskrives ordene "nettsted", "server", "leverandør" - russisk, engelsk, tysk eller alt på en gang?
Derfor er det verdt å begrense oss bare til generelle beregninger som ikke later til å være vitenskapelige. Når det gjelder det russiske språket, ifølge språkforskere, inneholder det omtrent 500 000 ord. Dette tallet er omtrentlig og inkluderer ikke spesifikke vitenskapelige termer. Men her er det utdaterte, lånt fra andre språk, komplekse ord, kjærlige, diminutive former og andre. Hvis vi vender oss til den autoritative Big Academic Dictionary, som består av sytten bind, vil den inneholde 131,257 ord. Det bør imidlertid huskes at utgivelsesåret er 1970, og det russiske språket har gjennomgått mange endringer de siste 40 årene og har blitt betydelig beriket med slike begreper som for eksempel "perestroika", "Internet", etc.
Når det gjelder det engelske språket, ifølge Global Language Monitor, oversteg antallet ord i 2009 tallet en million og fortsetter å vokse. Videre har det millionte ordet blitt "Web 2.0". I følge autoritative ordbøker ligger engelsk også foran russisk. For eksempel inneholder den tredje utgaven av Webster's Dictionary 450 000 ord, Oxford - omtrent 500 000 ord.
Av spesiell interesse er hieroglyfiske språk, der et eget symbol ikke betegner en bokstav, men et helt ord. I dette tilfellet er direkte sammenligninger helt umulige. Men hvis vi sammenligner ordbøkene, mister slike språk til alles overraskelse mye. For eksempel inneholder den mest komplette japanske ordboken 50 000 tegn. Men det japanske utdanningsdepartementet godkjente bare 1850 tegn til daglig bruk. Det kinesiske språket inneholder omtrent 80 000 hieroglyffer. Men i virkeligheten brukes mye mindre også her. Den statlige standarden "Grunnleggende sett med hieroglyfer" godkjent i 1981 inkluderer 6763 hieroglyffer.
På en uventet måte er det italienske språket blant de kvantitative lederne. I den er alle sammensatte tall skrevet i ord sammen, i ett ord. Tallserien er som kjent uendelig, så antall ord på italiensk viser seg å være uendelig.