nyest.hu
Kövessen, kérem!

Nem lát minket a Facebookon?

Kenyérpirítón szeretné?

Legutolsó hozzászólások
A nyelvész majd megmondja
A legnépszerűbb anyagok
Írjon! Nekünk!
nyest.hu
nyest.hu
 
Hány betű az sz?

Nem csak a keresztrejtvényfejtőknek számít, hány betű az sz. Bemutatjuk, hogy a kettősbetűket nem kezelik egységesen a helyesírási szokások.

Szigetvári Péter | 2016. február 4.
|  

Az iskolában azt tanították, hogy a magyar ábécében 44 betű van. (Az angolban meg csak 26, tehát bibibí.) A magyar szám úgy jön ki, ha apait-anyait beleadunk: külön betűnek számítjuk a több betűből álló „betűket” is, mint például a cs, gy, sz. Ezek volnának a többjegyű betűk. Tehát a c meg az s a cs-ben nem betű, hanem jegy. „Sok növénynek van, négy betű, mi az?” Lehet-e a válasz a szár, az három, vagy négy betű? Egyáltalán, miért számít ez a keresztrejtvényfejtőkön kívül bárkinek is?

Hogy jön ez ide?
Hogy jön ez ide?
(Forrás: Wikimedia Commons / rlevente / CC BY-SA 2.5)

Elválasztás

Hogy elkerüljük a betű szakkifejezés okozta kétértelműséget, a továbbiakban ezen csak a „keresztrejtvény-betűt” értjük: az sz tehát két betű. Amikor az sz a [sz] hangot jelöli (mint például a szár szóban), akkor digráfnak (két betűből álló jelnek, hagyományosan kétjegyű betűnek) fogjuk nevezni. A kékeszöldben viszont a sz két betű és két „monográf”.

Az első szempont, ami fontossá teszi, hogy tudjuk, minek számítanak az sz és társai, az elválasztás: digráfot nem lehet elválasztani. Tehát míg a kékes-zöld jó elválasztás, a kös-zönt nem az. (Többek közt ezért kell elektronikus szövegeinkben jelölni, milyen nyelven vannak, főleg, ha automatikusan választunk el.)

Azt gondolhatnánk, hogy a magyar digráfok egy részénél nincs kétértelműség: a gy, ly, ny, ty mindig digráf és elválaszthatlan. Azonban a hagyományosan írt családnevek még itt is gondot okozhatnak. Ugyan ezekben az y szinte mindig szó végén fordul elő, így sem világos elsőre, hogy az Áprily lehet-e Ápri-ly (lehet), miközben a Borbély nem lehet Borbé-ly. Sok esetben a dolog megoldható volt egy amúgy sem ejtett h betoldásával: Hor-thy vs. korty, Sá-ghy vs. ágy, de néha ezt is túltolták, mint Balog a biciklit: Batthyány nevében a h elegánsnak hat, de roppant félrevezető, hisz épp azt kéne jeleznie, hogy a t és az y nem tartozik össze, pedig de. A név azt is mutatja, hogy n (és l) után nem lehet a h-val megoldani a helyzetet: az ejtés [battyányi], vagyis az y itt a névvégi [i]-t is képviseli, tehát lehet Batthyá-ny az elválasztás, de talán a legjobb, ha átfogalmazzuk a mondatot, hogy ne kerüljön a sor végére.

Nana…
Nana…
(Forrás: The Plug)

Az elválasztás egyébként arra utal, hogy a ch is digráf: a-chát, me-chanikus. Az is igaz, hogy ugyanezt elmondhatjuk más esetekben is: Fi-sher (sőt Fi-scher), Coe-lho. Az elválasztás tehát a kiejtés alapján határozza meg a digráfokat, hiszen az elválasztás igyekszik a szótagok határára tenni a kötőjelet.

Sorbarendezés

Hosszabb listákat érdemes valamilyen szempont szerint rendezni, hogy az egyes elemeit gyorsabban meg lehessen találni. A leggyakoribb sorrend az úgynevezett ábécérend. Ez a betűknek a főníciaiaktól örökölt sorrendje, egy több mint 3000 éves hagyomány. (Maga az ábécé-rendbe sorolás viszont jóval újabb dolog, a nyomtatás elterjedése óta létezik.)

A 26 alapbetű sorrendje tehát adott, a kérdés az, mi legyen a többivel. Az izlandi ábécében például van ð, amit a d után sorolnak, mert annak módosított formája, és van þ, ami viszont az ábécé végére került, mert ez egy korábbi rúnaírásból fennmaradt betű. Ugyanitt találjuk az æ-t és az ö-t is, nem az a, illetve az o után. A magyar ábécében ezzel szemben a mellékjeles magánhangzó-betűk az alapbetűjüket követik (a, á; o, ó, ö, ő stb.). A német sorbarendezés még trükkösebb: az ä, ö, ü nem az a, o, u után áll, hanem úgy sorolódnak be, mintha ae, oe, ue lenne helyettük (aminthogy lehet is). Tehát az Öfen ’tűzhelyek’ az Ofen ’tűzhely’ előtt áll. (Ezt a konvenciót azonban nem mindig követik, gyakran előfordul, hogy az umlautos betűk az alapbetűjükkel azonosan kezeltetnek, mint a magyar a–á, e–é stb.) Érdekes még, hogy a török ı helye az i előtt van, bár ha jobban belegondolunk, ez jogos, hiszen az i-n a pont mellékjel!

A digráfokat az ábécérendbe-sorolásnál jellemzően nem veszik figyelembe. Azaz az angol sgurr ’hegycsúcs’ után jön a ship ’hajó’, majd a sip ’kortyol’. A korábbi, a ch-t és ll-t az ábécérendbe-sorolásnál egybevevő spanyol hagyományt is feladták már. A magyar azonban kitart ezen a téren (jócskán nehezítve a számítógépes sorbarendezést kódolók életét).

Az sz okozza a legkevesebb problémát, hiszen az összes s-betűs szó után kerülne az sz, akár digráfnak tekintjük, akár nem. A cs és a zs már nehezebb dió, hiszen külön kezelve őket megelőzi a cukorcsók-ot, a zuza a zsák-ot. Ráadásul a családnevekben előforduló cz meg már nem számít ilyen szempontból digráfnak, ezért a Czuczor is a Csaba elé kerül. De még az y-végű digráfok is okozhatnak keveredést: egzaltált < egy, pulzus < pulya, enzim < Enya stb. (Vagy az Enyában mégsem? Van ennek értelme?)

A csók a cukor után jön
A csók a cukor után jön
(Forrás: Devianart.com / ImLauraa)
A cseh és szlovák ábécérend érdekessége, hogy a ch a h-t követi, nem a c-t. Ennek mintájára lehetne a magyarban is juh < lyuk < kulcs <lak.

Ha mindez nem lenne elég, az egyszerűsítve írt kettőzött digráfok tovább bonyolítják a helyzetet. Az asszony látszólag az aszály elé volna sorolandó, de persze nem, mert úgy viselkedik, mintha aszszony-nak volna írva, vagyis mindkét szó asz-szal kezdődik és az á < sz dönt. Ésszerű! (Oh wait…) Az egész bonyodalom azért felesleges (ahogy a spanyolok is rájöttek), mert egyszerűen megszokás kérdése, melyik van előbb, az ilyen párok amúgy is közel lesznek egymáshoz, ráadásul a nyelvet használók nagy részének fogalma sincs ezekről a finomságokról, tehát kétséges, hogy az asszonyt mindenképp az aszály után keresnék. Az as-zály elválasztás valóban megzavarná az olvasót, az ábécérend észszerűsítése azonban nem.

Monogram

Az angol Philip Davies monogramja P.D., a francia Philippe Dubois-é viszont Ph.D. A magyarban is a francia minta érvényesül, a szerző monogramja Sz.P., nem S.P. Láttuk, hogy a sorbarendezésnél csak a ma bevett digráfok számítanak, különben az Eötvöst az ötvös után kellene sorolnunk. Nincs ez másképp a monogramoknál sem, itt se számítanak az olyan egy hangot képviselő betűkapcsolatok, amelyeket az elválasztás viszont figyelembe vesz. Az Eötvös Loránd Tudományegyetem ELTE, nem EÖLTE, miközben a szegedi egyetem SZTE, nem STE.

Vajon mi lehet Cházár András monogramja? Esetleg kérdezzük meg Chikán Attilát?

Követem a cikkhozzászólásokat (RSS) Az összes hozzászólás megjelenítése
Hozzászóláshoz lépjen be vagy regisztráljon.
63 Sultanus Constantinus 2016. február 15. 08:52

@hhgygy: @szigetva: Valóban, nem jól emlékeztem, abban voltam csak biztos, hogy valamilyen víz.

dle.rae.es/?w=chocolate

62 nadivereb 2016. február 14. 22:45

@Janika: "nem mindegy, hogy egy mellékjeles A betűt csak az ilyen A betűk között kell keresned, vagy általában bárhol előfordulhat."

Eleve nem bárhol fordulhat elő. De szerintem hagyjuk ezt a vitát, teljesen meddő. Én nem állítottam, hogy nem kell sorrend, hanem csak azt, hogy

1) már van egyezményes sorrend

2) a jelek szerint ez az egész mindeddig senkit nem zavart/érdekelt annyira, hogy csináljon egy másikat. Vagy ha csinált is, nem terjedt el (talán mert ilyen sorrendre szinte sehol nincs szükség, ahol meg igen, oda megfelel a Unicode). Szóval nyugodtan csinálj olyan sorrendmeghatározást, amilyet akarsz, szerintem már most bőven sokkal többet foglalkoztunk a témával, mint amennyit érdemel.

61 szigetva 2016. február 14. 22:41

@hhgygy: De ezt @Sultanus Constantinus mondta, Fejes csak idézte. Olyan nagyon nem tudni pontosan: en.wiktionary.org/wiki/chocolate#Etymology

60 hhgygy 2016. február 14. 22:16

@Fejes László (nyest.hu): A csokoládé nem "fekete víz", hanem "keserű víz", legalábbis a Wiki szerint

59 Janika 2016. február 14. 20:44

@nadivereb: nem mindegy, hogy egy mellékjeles A betűt csak az ilyen A betűk között kell keresned, vagy általában bárhol előfordulhat. Sőt ha a mellékjelekre is van egy könnyen tanulató sorrend, akkor szinte nem kell bemagolni semmit.

Pl a felső mellékjel megelőzi a lejjebb levőt, szinten belül a darabszám, azon belül meg a forma dönt. Ez utóbbi (de csak ez) már valóban önkényes. pl pont, karika, vonal, hullám, balra dől, jobbra dől, tető, ék.

Az erőssége ennek az lenne, hogy úgy tudnád meghatározni a helyét, hogy magukat a karaktereket nem kell ismered. Ha meg valaki nem is emlékszik pontosan, az sem keresné nagyon máshol egy felsorolásban.

58 nadivereb 2016. február 14. 19:52

@Janika: "Próbáld megtanulni fejből a unicode sorrendet és megtudod miért nem jó. Be kell magolni az egészet, vagy kéznél kell tartani egy kódtáblát."

Az Unicode-ban csak az A karakter módosított alakjaiból van 11. Ezeknek az egymás közötti sorrendjét mindenképp be kell magolni, vagy kéznél tartani egy kódtáblát. Innentől kezdve nem tökmindegy?

57 Janika 2016. február 14. 19:28

@nadivereb: "miért nem ilyen az unicode?"

Próbáld megtanulni fejből a unicode sorrendet és megtudod miért nem jó. Be kell magolni az egészet, vagy kéznél kell tartani egy kódtáblát. máshogy nem megy. Ellenben ha van egy olyan szabályunk, hogy minden mellékjeles betű az alap betű után következik, akkor azt az is tudja alkalmazni, aki egy adott jellel még életében nem találkozott. A mellékjeles betűk egymáshoz képesti sorrendjére is lehetne egyszerű szabályt találni, lásd El Vaquero javaslatát. Ha ez utóbbit valaki nem is tudja pontosan, az sem fogja teljesen máshol keresni.

Én nem egy nyelv 32 betűjéről beszélek, hanem az összes latin betűs nyelv összes mellékjeléről. Ez akár 100 felett is lehet.

56 nadivereb 2016. február 14. 18:55

@Janika: miért nem ilyen az unicode? Van a rendszerben egy sorrend, ami minden karaktert tartalmaz? Igen. Bővíthető tetszés szerint? Igen. Innentől kezdve minden kifogásod esztétikai jellegű. Hogy mi a könnyen megjegyezhető, az pl. teljesen szubjektív.

Az izlandi ábécé amúgy a wiki szerint 32 betűt tartalmaz. Ez van, amihez képest sok, van, amihez képest kevés.

55 Janika 2016. február 14. 18:34

@nadivereb: "Az, hogy ezzel neked esztétikai/egyéb problémád van, már a te privát problémád. De nyugodtan megalkothatsz egy egységes sorrendet minden mellékjeles betűvel együtt, és ha kevésbé butaság, el is terjedhet. Nosza!"

A sorbarendezls nem öncélú. Azt segíti, hogy könnyebben megtaláljunk egy elemet egy rendezett listában. Egy ilyen egységes rendszer ezért akkor lehet jó, ha könnyen megjegyezhető, azaz könnyen megtanulható az elemek sorrendje. A unicode (nem junikód?) érték nem ilyen. Az említett izlandi, finn, svéd példa is csak azért működik mert kevés ilyen betű van.

@Fejes László (nyest.hu): "A magyar helyesírásnak nem lenne feladata a magyar betűk sorbarendezése sem, mert ez nem helyesírási kérdés"

Ebben egyetértek. A helyesírási szabályzat ennek ellenére külön részben, a 14,15,16-os pontokban a sorbarendezéssel foglalkozik. Lehet nem kellene, ha valóban lenne erre nemzetközi nyelvfüggetlen megállapodás.

Ha csak a latin betűs ábécékre valósulna meg már az is nagy előrelépés lenne a mostani kaotikus állapothoz képest.

54 Sultanus Constantinus 2016. február 7. 18:52

@Fejes László (nyest.hu): A spanyolban is van ilyen jelentése: dle.rae.es/?id=NndQJAy (ld. 5.).

Amúgy ez csak egy példa volt a problémára. Ha csak azt tekintjük spanyol jövevényszónak, ami közvetlenül onnan került a magyarba, akkor ilyen szó nincs. Mégis vannak a magyarban spanyol eredetű szavak. Szóval a kérdés nem annyira egyértelmű.

53 Fejes László (nyest.hu) 2016. február 7. 18:05

@Sultanus Constantinus: „aki pl. kíváncsi arra, hogy a "macsó" szó milyen eredetű, rohadtul nem fogja érdekelni a nyelvészeknek ez a szarrágása, hanem előveszi az idegen szavak szótárát vagy valami hasonlót és megnézi, amelyben nyilván az lesz, hogy "spanyol"”

Hát az elég rossz szótár, ha a macho nem közvetlenül került a spanyolból a magyarba. (Ha meg igen, akkor pont azért van, mint amit magyarázunk.) Ráadásul ha jól veszem ki a forrásokból, a spanyolban ’hím’ vagy ’bátor’ a jelentése, és csak az angolban alakult ki az, amelyik a magyarban is megvan. Viszont a latinban masculus volt, és ugyanazt jelentette, mint a spanyolban, szóval ha már vissza akarunk menni, akkor legalább a latinig kell.

„Nyugodtan ki lehet engem röhögni és lehet hülyének nézni” Nehéz mást tenni, ha addig forgatod a tényeket, míg az nem jön ki, hogy spanyol...

@El Vaquero: „a laikust általában az utóbbi érdekelné, és nem az, hogy az adott nyelv milyen másik nyelv közvetítésével vette át”

Megint az a kérdés, hogy mi a cél. A nyelvészek abból indulnak ki, hogy azt szeretnénk tudni, hogy az adott nyelv milyen nyelvekkel állt kapcsolatban, ill. milyen mértékig. Ebből a szempontból az a fontos, hogy a magyar a paprikát a szerbhorvátból vette át, nem a törökből, mert sok más szó történetével együtt ez mutat rá, hogy az oszmán megszállás alatt olyan erős közvetlen török-magyar kapcsolat nem volt, viszonylag kevés szó került át közvetlenül a törökből, annál több délszláv közvetítéssel. Másfelől pl. a csoki esetében hiába jutunk el az aztékig, lehet, hogy a szó ott is máshonnan van, csak éppen erről már nincs információnk. De pl. a magyarban már több különböző nyelven, különböző útvonalakon át jutott el, és ezek közül éppen a spanyolt kiemelni finoman szólva is elfogultságra utal.

52 El Vaquero 2016. február 6. 23:39

@Irgun Baklav: jó lesz ám, ha nem szoksz rá ilyen jenki szótárakra, mint ez a Webster-Mariska, mert ilyen amcsi etimológiázás után Lizzy téged sem fog meghívni teázni. Én már menthetetlen vagyok, de te inkább mentsd, ami menthető.

51 El Vaquero 2016. február 6. 23:36

Etimológiában nem vagyok otthon, de meg kéne különböztetni közvetlen forrást és ősforrást/keletkezési forrást. Abban szerintem El Sultanonak van igaza, hogy a laikust általában az utóbbi érdekelné, és nem az, hogy az adott nyelv milyen másik nyelv közvetítésével vette át, az csak akkor érdekes, ha valami ejtési, helyesírási kérdésre ad magyarázatot, amire az ősforrás nem .

 

Egyébként meg egyikőtök sem ért hozzá, mert a gyökvázat kéne nézni, és nem az indobolgár nyelvészeti hazugságokkal foglalkozni :D

50 Irgun Baklav 2016. február 6. 22:15

@Sultanus Constantinus: Nézd, az a helyzet, hogy itt a „nyelvészeti szarrágás” onnan indult, hogy egy olyan mondathoz, ami NEM a szó eredetéről szólt, hanem az angolban az anyanyelvi beszélők által érzékelhető státuszáról (ti. angol szó-e) szólt, és ilyenformán csak a szó átvételének közvetlen forrásnyelvét érintette;

„A pneumonia szerintem azért más kategória, mert az hiába »latin«, az angol anyanyelvűek többsége érti é[s] rendszeresen használja.”

jöttél te azzal, hogy

„A »pneumonia« nem latin, hanem görög, bocs!”

Mikor egyébként maga a szó a források egybehangzó tanúsága szerint görög is, meg (orvosi, modern) latin is (és az ebből a szempontból igazából mindegy, hogy utóbbiban maga is jövevény). Ha csak azt írtad volna, hogy „a latinban viszont görög eredetű jövevényszó”, akkor ezzel én is, de szerintem kb. mindenki más is egyetértett volna.

Ami a te álláspontodban önkényes, az az „ebben a formában” rész, ti. itt egyáltalán mi a forma definíciója (amúgy pl. a chocolate-re azt találjuk hasonló forrásokban, hogy a szó azték eredetű, és spanyol közvetítéssel került az angolba).

49 Sultanus Constantinus 2016. február 6. 21:48

@Irgun Baklav: Nézd, egy laikust, aki pl. kíváncsi arra, hogy a "macsó" szó milyen eredetű, rohadtul nem fogja érdekelni a nyelvészeknek ez a szarrágása, hanem előveszi az idegen szavak szótárát vagy valami hasonlót és megnézi, amelyben nyilván az lesz, hogy "spanyol", mert ebben a nyelvben keletkezett a szó ebben a formában. A nagyközönségnek ez a lényeg. Senkit nem érdekel innentől kezdve, hogy hogy ejtik ki az angolok vagy a kínaiak vagy a japánok, és az sem, hogy melyik nyelven keresztül került a magyarba (vagy akárhova). Nyugodtan ki lehet engem röhögni és lehet hülyének nézni, de megint az az érzésem, hogy túlzásokba estek...

Az összes hozzászólás megjelenítése
Információ
X