internet šumniki na svetovnem spletu strešice slovenščina nabori znakov nabori znakov ASCII in Unicode
1Kot eden kjučnih problemov slovenščine vidim njeno prisotnost v spletu, predvsem glede šumnikov (Morda poznate članke Janeza Suhadolca o bohoričici
...). Očitno je, da teh zaenkrat ni mogoče neovirano uporabljati (kar se vidi tudi na vaši strani). Doslej sem v praksi opazil sledeče resitve: slovenscina, slovenshchina, slovenssccina, slovens*c*ina. Kaj je storiti glede tega oziroma kakShne so perspektive dolgorozhne reShitve tega vpraShanja?
1Zelo verjetno vam kaj prav zares novega ne bomo povedali. Pač nismo računalničarji, smo le uporabniki njihovih izdelkov.
2Za začetek bom skušal na kratko opisati problem. Vsaka črka ima v računalniku določeno štirimestno številsko kodo. Ta koda omogoča 128 različnih znakov, toliko jih vsebuje tudi standardni ASCII nabor. Trenutno obstaja poleg običajnega še razširjeni ASCII, ki ima dodatnih 128 znakov. Osnovne
črke, ki se uporabljajo pri zapisovanju dominantnih svetovnih jezikov, so del osnovnega ASCII-ja in jih lahko normalno vidimo na vseh računalnikih. Razširjena nabora ASCII za DOS za vzhodnoevropske jezike, ki imata naše šumnike, sta (najbolj znana) dva: 437 in 852. V Windowsih se uporablja znakovni nabor 1250, katerega dodatni problem je ta, da je čisto Microsoftova iznajdba. Težava nastopi, ker vsi programi kot privzet nabor uporabljajo ASCII, saj drugega obsežnejšega standarda še ni. Obstajajo le poskusi. Kolikor smo uspeli zvedeti, naj bi problem dokončno rešil novi standard Unicode, ki za vse znake predvideva 16-bitni zapis, kar nudi okrog 65.000 znakov. To naj bi zadostovalo za vse jezike sveta, vključno z azijskimi, četudi se nekateri že zdaj pritožujejo, da tudi to ne bo dovolj.
3Unicode naj bi torej rešil težave vseh neangleško pišočih jezikov, vendar Unicode še ni priznan in spoštovan standard, lepo pa bi bilo imeti kakšno rešitev tudi za prehodno obdobje.
4Sami smo pristasi najenostavnejse mozne resitve, tj. pisanja brez stresic. Preizkusili smo tudi nekaj drugih nacinov pisanja, vendar smo pri vsakem nasli pomanjkljivosti.
5Nekateri recimo s*umnike zapisujejo z zvezdico, ki neposredno sledi c*rki. Tak zapis sicer ne povzroc*a dvoumnosti, vendar nam vsaka zvezdica zavre branje, saj je nismo vajeni videti sredi besed. Stres*ice s*e vedno beremo po knjigah in c*asopisih, povsem obic*ajno pa jih uporabljamo tudi pri pisanju v urejevalnikih besedil.
6Podobno ne povzrocca dvoumnosti zapis ssumnikov s podvojenimi ccrkami. Vendar podvojena ccrka ravno tako ustavi branje, saj jo zaznamo kot motnjo, kot napako pissoccega. Dvojne ccrke v slovenssccini niso ravno pogoste, torej velikih dvoumnosti niti ne moremo zagressiti. A je ta ressitev sse vedno dalecc od idealne. Ekstremen primer ccudnosti je zapis nicc posebej nove ugotovitve, da so v Sloveniji vecccclanske druzzine izzzivete.
7V primerjavi z zgornjima mozhnostima se zdi ta s pisanjem na angleshki
nacin se najbolj oddaljena od idealne. Ta mozhnost povzrocha poleg motenj v branju (te so malenkost manjshe, saj sklope sichnikov in h-ja poznamo) tudi mozhnost napacnega branja in s tem dodatno zaviranje branja (kako naj vemo, kaj je na sheleshamer nachichkana dachauska mesechna shujshevalna shema, in kaj bi pomenilo, da bo schasoma porsche zhe dirkal z enim machom), pa celo dvoumnosti, ki jih sicer resda opazimo bolj poredko, saj navadno brez tezhav iz konteksta razberemo, za kaj gre. Probleme pa bi imeli tudi pri imenih oz. branju nepoznanih besed. Povrh vsega ima slovenshchina tudi nekaj besed, izpeljanih iz nemshkih imen. Nemci za razliko od Anglezhev ch
berejo kot /h/ in sch
kot /š/. Italijanom pa ch
pomeni /k/ (chianti). Vse to bi povzrochalo tezhave, saj omenjene besede zapisujemo citatno.
8Vse kaze, da nam preostane le se ena moznost — opuscanje stresic. Ta moznost sicer prinese se najvec dvoumnosti, vendar te, kot receno, ne povzrocajo velikih preglavic, saj jih pogosto niti ne opazimo. Med branjem vedno iscemo relevantno nadaljevanje stavka in pogosto drugega moznega pomena sploh ne opazimo. Hkrati ta moznost ne prinasa vecjih motenj pri branju, saj so vse crke in njih sklopi povsem naravni in obicajni, pa tudi zapisovanje je najenostavnejse, ker del znaka spuscamo (pravzaprav eliminiramo kar tri tipke na tipkovnici), pri vseh ostalih nacinih pa se nam delo poveca, ker obicajnemu zapisu znake dodajamo (*, h, s/c/z).
9Res ne vem, kaj drugega bi še lahko dodal. Upajmo, da bo omenjeni Unicode kar se da hitro sprejet kot standard, saj ga čez strešice ni.