Lingvističke aktuelnosti

Upisano u kategoriju: Pregledni članci, Broj 6

 

Miloš Rančić  (Beograd)

NORMA KODNIH RASPOREDA I SRODNA PITANjA
(drugi deo)

Naše potrebe i skupovi znakova

Naše azbučne i znakovne potrebe mogu se podeliti na sledeće skupove (po važnosti):

1)       Osnovna ćirilica i latinica.

1.1.   Ćirilica.

1.2     Latinica.

2)       Osnovni neazbučni znaci (brojevi, rečenični i pravopisni znaci, akcenatski znaci itd.).

3)       Akcentovana slova.

3.1.   Ćirilička.

3.2.   Latinička.

4.        Skupovi naučnih, kulturnih i ostalih znakova za društvenu upotrebu.

5.        Ćirilice u kulturnoj upotrebi našeg naroda.

5.1.   Savremene slovenske ćirilice.

5.2.   Starosrpska i staroslovenska ćirilica.

6.        Latinice u kulturnoj upotrebi našeg naroda.

6.1.   Savremene evropske latinice.

6.2.   Istorijski korišćene latinice (kao što je Daničićeva latinica).

7.        Grčko pismo.

7.1.   Osnovni skup znakova.

7.2.   Prošireni skup znakova.

8.        Glagoljica.

8.1.   Obla.

8.2.   Uglata.

9.        Jevrejsko pismo.

Sledi detaljan opis odnosa naših potreba prema postojećim kodnim rasporedima.

Osnovna ćirilica i latinica

U ovu grupu spadaju osnovna slova naših azbuka. Konkretno vezano za predstavljanje slova na računaru, naša latinica podrazumeva i jednokarakterne digrame za slova „lj“, „nj“ i „dž“.

Ćirilica

Osnovna slova naše ćirilice podržana su u većini kodnih rasporeda.

Sedmobitni kodni raspored koji podržava našu ćirilicu jeste JUS I.B1.003–S, koji se kao internacionalni standard zove i ISO IR–146. Postoje još dva sedmobitna ćirilička kodna rasporeda, koji su nekad bili u široj upotrebi, ali oni podržavaju samo rusku ćirilicu. U pitanju su kodni rasporedi KOI i KOI 7.

Osobenost osmobitnih kodnih standarda jeste stvaranje većeg broja različitih rasporeda koji istom služe. Tako postoji veći broj osmobitnih kodnih rasporeda koji podržavaju našu ćirilicu: ISO 8859–5, CP 855, CP 870, CP 1251, KOI 8 European, KOI 8 Unified i Mac Cyrillic. Ruski ćirilički osmobitni kodni rasporedi koji ne podržavaju srpsku ćirilicu jesu: CP 866, KOI 8a, KOI 8b, kao i niz KOI 8 kodnih rasporeda kojima se služe različiti narodi sa prostora bivšeg Sovjetskog Saveza.

Naša osnovna ćirilica spada u osnovni skup ćriličkih znakova Junikoda.

Latinica

S latinicom stvari stoje malo složenije. Razlog za to je njena nejednoznačnost. Doskora smo morali sebe prilagođavati računarima. Morali smo pisati onako kako nam uske mogućnosti nametnutih američkih standarda dopuštaju. Sada to više nije potrebno; naprotiv, računari se prilagođavaju ljudima. U tom smislu nemamo ni nacionalnog ni naučnog prava da odustanemo od jednokarakternih latiničkih digrama za „lj“, „nj“ i „dž“ kao osnovnog dela našeg latiničknog pisma. Sitni problemi koji se javljaju prilikom korišćenja latinice sa ovim znakovima mnogo su manji od onih koji se javljaju prilikom korišćenja tog pisma bez njih.

U ovom smislu jedino Junikod podržava našu latinicu. Ostali, sedmobitni i osmobitni kodni rasporedi ne podržavaju je u potpunosti, već se za digrame moraju koristiti dva karaktera.

Sedmobitni kodni raspored koji delimično pokriva naše latiničke potrebe jeste JUS I.B1.002, odnosno ISO IR–141.

Osmobitni kodni rasporedi koji delimično pokrivaju naše latiničke potrebe jesu: ISO 8859–2, CP 852, CP 880, CP 1250 itd.

Osnovni neazbučni znaci (brojevi, rečenični i pravopisni znaci, akcenatski znaci itd.)

U ovu grupu znakova idu oni neazbučni znaci koji se nalaze u Junikod skupovima: C0 Controls and Basic Latin, C1 Controls and Latin–1 Supplement, Diacritical Marks, General Punctations, Currency Symbols i Number Forms. Svi nama potrebni znakovi (osim kratkosilaznog akcenta i možda dugosilaznog) predstavljaju opšti skup znakova evropske civilizacije. Zato je potrebno samo slediti ono što međunarodne institucije usvoje i realizuju kroz Junikod.

Osim najosnovnijih znakova, kao što su brojevi i osnovni rečenični i pravopisni znaci, ove znakove nije moguće koristiti u sedmobitnim i osmobitnim kodnim rasporedima. Zato se koriste višekarakterne zamene (recimo, pišu se tri tačke umesto znaka za tri tačke, pišu se velika latinička slova umesto rimskih brojeva, koristi se jedan oblik crte umesto bar tri različite po širini itd.), što nije dobro ni stilski ni formalno, a prihvatljivo je jedino ako nije moguće drukčije.

Akcentovana slova

Tipografska pravila poseduju nešto veći standard nego funkcionalna lingvistička (i ostalih nauka). Kao što je ranije rečeno, osim programskog paketa TeH, nijedan drugi ne omogućava „pametne“ izmene izgleda slova. Ovo je posebno važno kod akcenatskih znakova.

Tako postoje dva tipična primera: prvi je taj što je akcenat iznad velikih slova i na većoj visini i sam po sebi veći od akcenatskog znaka nad malim slovom. Drugi se tiče akcentovanog malog latiničkog slova „i“, koje nema tačku, već akcenat stilski tačku nadomešćuje.

Treba napomenuti da postoji određeni broj znakova koji nadomešćuje latinički skup akcentovanih znakova (uglavnom su u pitanju samoglasnici s kratkouzlaznim i dugouzlaznim akcentom, kao i genitivska dužina nad slovom „a“), ali da to ne zadovoljava naše potrebe.

U našem jeziku postoji pet samoglasnika i šest distributivno slogotvornih fonema. Pored toga, za potrebe transkripcije naših dijalekata neophodni su i akcentovani poluglasnici, odnosno znak „šva“. Za slovo „a“ je potrebno imati i oblik s genitivskom dužinom.

Ćirilička

Za ćirilicu je, dakle, potrebno:

2 * (6 * [a[ + 5 h ([e, i, o, u, ъ, ь, r, l, lj, m, n, nj])) = 132 dodatna znaka.

Latinička

Za latinicu je, pošto postoji po tri oblika slova „lj“ i „nj“, potrebno je nešto više dodatnih slova:

3 * (5 * ([lj, nj])) + 2 * (6 * [a] + 5 * ([e, i, o, u, x, y, r, l, m, n])) = 142 dodatna znaka.

(Latinička slova „x“ i „y“ uzeta su mesto tvrdog i mekog poluglasnika.)

Skupovi naučnih, kulturnih i ostalih znakova za društvenu upotrebu

U ovu dodatnu grupu spadaju znakovi iz sledećih Junikod skupova: IPA Extensions, Spacing Modifier Letters, Superscripts and Subscripts, Combining Marks and Symbols, Letterlike Symbols, Arrows, Mathematical Operators, Miscellaneous Technical, Control Pictures, Optical Character Recognition, Enclosed Alphanumerics, Box Drawing, Block Elements, Geometric Shapes, Miscellaneous Symbols, Dingbats, Braille Patterns, Alphabetic Presentation Forms i Small Form Variants. U Junikodu 3.1 postoje još i sledeći posebni skupovi simbola koji bi mogli biti od interesa za našu normu: (1) vizantijski muzički simboli, (2) savremeni muzički simboli i (3) dodatni matematički simboli.

Ovi dodaci su posebni za određene nauke, kulture itd. U tom smislu, ako su nekoj našoj nauci potrebni dodatni znaci, onda to Junikodu treba i prijaviti.

Ćirilice u kulturnoj upotrebi našeg naroda

Dve su osnovne grupe ćirilica u kulturnoj upotrebi našeg naroda, pored srpske. To su savremene slovenske ćirilice i staroslovenska, starosrpska i crkvenoslovenska ćirilica. Ostale ćirilice, one kojim pišu raznoliki neslovenski narodi na prostoru bivšeg Sovjetskog Saveza i Mongoli, treba tretirati istovetno ostalim pismima koja nisu u neposrednom dodiru sa našom kulturom, pa ih tako valja preuzimati isključivo iz međunarodnih standarda.

Savremene slovenske ćirilice

Osmobitni ćirilički kodni standardi koji pokrivaju našu ćirilicu (ISO 8859–5, CP 855, CP 870, CP 1251, KOI 8 European, KOI 8 Unified i Mac Cyrillic), pokrivaju i sve ostale slovenske ćirilice. Jedini problem čini novo ukrajinsko slovo „Ґ“, koje u kodnim rasporedima nastalim osamdesetih godina i ranije ne postoji.

Junikod ove ćirilice u potpunosti pokriva (u skupu znakova Cyrillic), dok ih sedmobitni kodni raspored JUS I.B1.003–S ne pokriva.

Starosrpska, staroslovenska i crkvenoslovenska ćirilica

U okviru Junikod skupa znakova Cyrillic postoji minimalna staroslovenska ćirilica. Ona, ipak, ne pokriva ne samo sve tipografske zahteve (posebna slova s dijakritikama), već ne poseduje ni neka posebna varijantna slova. Zato je neophodno načiniti studiju o slovima i znacima koji su za staroslovenski, starosrpski i ostale crkvenoslovenske jezike potrebni. To bi valjalo učiniti u saradnji s tipografima koji su već imali iskustva u radu s fontovima.

Latinice u kulturnoj upotrebi našeg naroda

I kad su latinice u pitanju, potrebno je ograničiti se na evropske jezike pre svega.

Savremene evropske latinice

Njih pokrivaju uglavnom Junikod skupovi C0 Controls and Basic Latin, C1 Controls and Latin–1 Supplement, Latin Extended A i Latin Extended B.

Različiti sedmobitni i osmobitni kodni rasporedi, kao što su ISO 8859–1, CP 850, CP 1252 itd., pokrivaju ova slova, ali o njima ne treba puno razmišljati jer direktno onemogućavaju pisanje ma kojom našom azbukom.

 Daničićeva latinica

Daničićevu latinicu pokrivaju Junikod skupovi Latin Extended A i Latin Extended B.

Grčko pismo

Grčko pismo je deo naše kulture i nauke. Stoga treba i njega uvrstiti u skup potrebnih znakova.

Osnovni skup znakova

Osnovni skup grčkih znakova pokrivaju, pored osmobitnih kodnih rasporeda ISO 8859–7, CP 737 i CP 1253, Junikod skup Greek and Coptic.

Prošireni skup znakova

Prošireni skup grčkih znakova sličan je skupu znakova koji bi trebalo da sadrži naša akcentovana slova. Tu se nalaze grčka slova za samoglasnike i suglasnik „r“ s akcentima i spiritusima. Postoji, kao i naš skup akcentovanih slova, zbog tipografskih potreba.

Glagoljica

U zvaničnom dokumentu Junikoda „Unicode Technical Report #3“ iz 1992. godine detaljno su opisane potrebe glagoljice. Ipak, do danas (Junikod verzija 3.1) glagoljica u Junikodu nije pokrivena. Kako je glagoljica deo naše negdašnje kulture, potrebno je i nju pokriti. I to obe njene varijante: oblu i uglastu.

Problem s Junikodom je taj što se zadržava, kao i kada je stara ćirilica u pitanju, samo na osnovnom skupu znakova (od četrdeset njih u ovom slučaju), dok ne vodi računa o određenim varijantama slova, niti o slovima sa dijakritikama.

Nijedan sedmobitni ni osmobitni kodni raspored, kao ni Junikod, ne pokriva glagoljicu.

Jevrejsko pismo

Deo naše hrišćanske kulture predstavlja i jevrejsko pismo. Kao što je deo računarskih nauka engleski jezik i njegovo pismo, tako je deo teologije jevrejski jezik i njegovo pismo.

Jevrejsko je pismo pokriveno u sledećim osmobitnim kodnim rasporedima: ISO 8859–8, CP 862 i CP 1255.

Junikod jevrejsko pismo pokriva u kodnoj strani Hebrew.

O ostalim pismima

Od ostalih pisama, jedino je potrebno razmišljati o arapskom, kao delu naše kulture za vreme turskog razdoblja i kulturi našeg muslimanskog stanovništva.

Ostala pisma treba jednostavno preuzimati iz međunarodnih i nacionalnih standarda drugih zemalja. Naravno, u Junikodu isključivo.

Prilagođavanje pisma

Pre svega, potrebno je omogućiti svakom na svetu da se koristi srpskim jezikom nezavisno od pisma i znakova kojim se služi. Naši su se ljudi tokom prethodnih godina toga i dosetili, pa su stvoreni različiti načini za pisanje srpskim jezikom pomoću engleske, odnosno ruske azbuke (slika 5).[1]

Srpskim jezikom se u osnovi piše pomoću dva pisma, dve azbuke.[2] Ovo predstavlja veliku prednost i ne treba je se nikako lišavati.

Ipak, pojave koje su mehaničke prirode treba ujednačavati. Tako raspored tastera na pisaćoj mašini, odnosno tastaturi računara treba da bude isti i za latinicu i za ćirilicu. Potrebno je da i znaci „lj“, „nj“ i „dž“ na latiničnoj tastaturu postoje na mestu gde postoje i na ćiriličkoj. Odnosno, treba pronaći možda neki drugi način po kome bi, opet, izgled tastatura bio ujednačen.

Ćirilica ima problem malih kurzivnih slova „g“, „p“ i „t“. Da li je to problem srpske ćirilice ili ćirilice uopšte, manje je važno. Neophodno je ujednačiti pisanje ovih slova. Da li će se ujednačiti prema ruskom obliku ili prema, npr., predlogu Mitra Pešikana — manji je problem.

Potrebno je, zarad formalnih potreba, izmeniti, odnosno precizirati određena pravopisna pravila. Pravopis danas mora ući i u sferu pripreme za štampu i unosa teksta u elektronski oblik. Tako je potrebno striktno odrediti korišćenje kapitale i verzala; potrebno je definisati tačno na kom mestu ide crtica, na kom crta, a na kom povlaka. I to u skladu sa što jasnijim formalnim razaznavanjem funkcije datih znakova. Potrebno je nesrpske unete reči u srpski tekst označiti i u latiničkom tekstu (tj., treba koristiti crticu iza stranog imena u osnovnom, neskraćenom obliku). Ovo je problem koji treba da reši tim stručnjaka, pre svega iz primenjene lingvistike.

Takođe, u skladu sa savremenim tokovima, dobro bi bilo razmišljati o raslojavanju grafije i ortografije. Već duže vreme vidna su previranja oko naše jezičke norme. Ova previranja, kako ih ja vidim, nisu odraz lične suprotstavljenosti, već suprotstavljenosti procesa u samom srpskom jeziku. Na jednoj strani pokušava se istrajati u liberalnoj tradiciji naše jezičke norme, s druge se pokušavaju zadržati određeni tradicionalni elementi u normi.

Rešenje je, možda, upravo raslojavanje i grafije i ortografije. Sadašnja grafija bi se, po tome, vezala za fonetsko–fonološku ortografiju, a jedna izmenjena grafija, koja bi omogućavala pisanje srpskog jezika naporedo samo ruskim ćiriličkom, odnosno engleskom latiničkom azbukom, vezala bi se za jednu morfofonološku ortografiju. Deca bi u školama prvo učila fonetsko–fonološku grafiju i ortografiju, a potom i morfofonološku.

Rešenja

Ukratko, rešenja bi se mogla svesti na sledeća:

Kodni rasporedi

Sedmobitni kodni rasporedi potpuno su zastareli. Osmobitni ne zadovoljavaju naše potrebe, ali su realnost, pa ih treba razmatrati. S Junikodom naša država mora uspostaviti kontakt i  priložiti naše potrebe. Ako Junikod ne želi da zadovolji naše potrebe, treba stvoriti poseban šesnaestobitni kodni raspored koji će ih zadovoljiti.

Tastature

Potrebno je ujednačiti ćiriličku i latiničku tastaturu, sa mogućnošću da se istorijskim pismima piše uz neznatne izmene na tastaturi. Dobar primer za to je predlog Mitra Pešikana. Treba posebno voditi računa i o našim dijakritičkim znacima i njihovim mestima na tastaturi.

Operativni sistemi i korisnički programi za unos i obradu teksta

Na ovom mestu treba posebno voditi računa o mogućnostima za razvoj i kvalitetnu štampu i obradu podataka.

Ovaj problem treba raslojiti na četiri nivoa:

1) Prvi nivo predstavljaju krajnji korisnici. Njih nije potrebno ničim uslovljavati za ličnu upotrebu, dok bi se u drugim slučajevima morali prilagođavati. U tu svrhu dobri su i programi kakva je Mikrosoftova Reč.

2) Drugi nivo predstavljaju štamparije i izdavači. Oni bi morali u tačno određenom formatu (TeH ili SGML) dostavljati elektronski oblik izdanja Narodnoj biblioteci (odnosno, drugoj nadležnoj instituciji) i to u određenim fontovima koje je država otkupila i proglasila javnim.

3) Treći nivo predstavljaju naše kulturne institucije, koje bi morale imati unificiran operativni sistem (operativni sistem Linuks vrlo je dobro rešenje, jer omogućava mnogo veću slobodu stvaranja i korišćenja programa, za razliku od mnogih ostalih, među kojima su i Mikrosoftovi Prozori) pod kojim rade njihovi računari, kao i identične programe itd.

4) Četvrti nivo prestavljale bi ostale državne institucije, koje bi morale uvažavati minimum prethodnog, a koristile bi sve u zavisnosti od svojih potreba.

Prevodi

Neophodno je i započeti sistematično prevođenje računarske literature i programa; odrediti pravilne prevode; načiniti zakonsku regulativu koja obeshrabruje nepravilnu upotrebu itd. Potrebno je u sve to uključiti što veći broj ljudi, što Internet omogućava.

U tom smislu trebalo bi napraviti na različitim posećenim mestima na Internetu (kakav je Internet čvor projekta „Rastko“) forme za slobodan unos predloga za prevode stranih termina. Posle određenog razdoblja (mesec dana, dva meseca, pola godine, godina) ovi bi se predlozi prikupljali, a grupe stručnjaka bi vršila odabir (ili bi na osnovu ovih predloga došla kakva nova ideja). Time bi se omasovio uticaj na standardni jezik, a postojala bi i određena vrsta legitimiteta za novouvedenu reč. Spremnost za ovakve poduhvate postoji, jedino Odbor još treba da ih ozvaniči.

Literatura

 

1)       Sveta Jovanović; UNIX; Institut za nuklearne nauke “Vinča”, Beograd, 1996.

2)       Cvetana Krstev; Jedan prilaz informatičkom modeliranju teksta i algoritmi njegove transformacije, doktorska disertacija, Univerzitet u Beogradu, Matematički fakultet, Beograd; 1997.

3)       Mitar Pešikan; Naša azbuka i njene norme, Vukova zadužbina, NIP Politika, Zavod za udžbenike i nastavna sredstva, Beograd; 1993.

4)       Mitar Pešikan, Mato Pižurica, Jovan Jerković, Pravopis srpskoga jezika sa rečnikom, Matica Srpska, Novi Sad; 1993.

5)       Predrag Piper; Uvod u slavistiku I, Zavod za udžbenike i nastavna sredstva, Beograd, 1998.

6)       Donovan Rebbechi, Font HOWTO, LDP.

7)       Ellen Siever, the Staff of O’Reilly & Associates; Linux in a Nutshell, O’Reilly, 2nd Edition, 1999.

8)       Radoje Simić, Branislav Ostojić, Božo Ćorić, Živojin Stanojčić, Miloš Kovačević, Pravopis srpskoga jezika sa rečnikom, Unireks, 1993.

9)       Živojin Stanojčić, Ljubomir Popović, Gramatika srpskoga jezika, Zavod za udžbenike i nastavna sredstva; Beograd, prvo izdanje 1992., više izdanja.

10)    Mihailo Stevanović, Savremeni srpskohrvatski jezik I i II, Naučna knjiga, 1969.

11)    Unicode Technical Report #3, Unicode Inc., 1992.

12)    Bruno Haible, Unicode HOWTO, LDP; v0.12, 19 October 1999.

 


[1] Имена прве три од ових српских услужних азбука узете су са Интернета. За „дуал“ је занимљиво и то да је исти предложио и Митар Пешикан у књизи Наша азбука и њене норме као једнозначан испис наше латинице у случају да нема наших слова. Усавршавањем ове идеје добијена су два крајња предлога: „танко јер” у ћирилици и „ипсилон” у латиници створили би потпуно транспарентан азбучни систем српског језика, а тиме и могућност да се на сваком рачунару на свету српским језиком може писати.  Штавише, пресловљавање са ћирилице у латиницу и обратно не би био никакав проблем.

[2] Треба разликовати два појма: писмо, које је једна општија културна појава, и азбуку, која представља скуп знакова једног писма у служби комуникације једног народа, односно језика.

Bez komentara »

No comments yet.

RSS feed for comments on this post. TrackBack URL

Leave a comment

You must be logged in to post a comment.

Napravljeno pomoćuWordPressa