Měření obtížnosti učebního textu na příkladu přístavku

1. 5. 2013

Měření obtížnosti učebního textu

na příkladu přístavku

Lingvistická charakteristika učebního textu

Zpracoval: Jiří Janíček, ČJ-NJ, 9. r.

Vedoucí kurzu: doc. PhDr. Eva Hájková, CSc., Dr.

30. dubna 2013

Motto:

„Popis adordinačních, resp. apozičních vztahů je jedním z nejsložitějších úkolů české syntaxe.“ (Mluvnice češtiny III, s. 434)

„Obtížnost textu (text difficulty) je tedy objektivní fenomén a jako takový jej lze v principu identifikovat, měřit, popsat, analyzovat a vyhodnocovat exaktními procedurami.“ (Někteří zahraniční autoři používají synonymně i termíny složitost textu (text complexity) nebo čtivost textu (readibility of text).)

(Průcha 1998, s. 56)

Úvod

Vedle subjektivního hodnocení obtížnosti textu, které nás v této práci nebude zajímat, existuje také hodnocení objektivní, které užívá metod a poznatků kvantitativní lingvistiky. Bylo zjištěno, že obtížnost textu zavdává především četnost (frekvence), a tudíž i obecná srozumitelnost volených výrazů v jazyce (používání z hlediska frekvence zřídkavých (řídkých) slov zvyšuje pravděpodobnost, že text bude obtížnější, než kdybychom volili výrazy častější) (hledisko kvantitativně lexikální) a syntax (délka a složitost vět i větných ekvivalentů). Existuje několik kvantitativních metod; Průcha (1998) uvádí čtyři: Flescherovu, Pisarekovu, Mistríkovu a metodu tria Nestlerová – Průcha – Pluskal (s. 58–61). Nejpřesnější (nejkomplexnější) informace nám dává měření tzv. komplexní míry obtížnosti textu (Nestlerová – Průcha – Pluskal), jejíž výpočet je složitější než výpočet podle ostatních zmiňovaných metod. Jde zde o míru (měření) složitosti textu (Textkompliziertheit) Käte Nestlerové, kterou v 80. letech modifikoval autor citované příručky a nestor české pedagogiky Jan Průcha a kterou v 90. letech inovoval M. Pluskal. Průcha ji označuje jako míru (T).

Složitost textu

Při podrobnějším pohledu lze obtížnost dělit na obtížnost sémantickou a syntaktickou.

Nepřekvapuje mne zjištění výzkumu učebnic pro 4.–8. ročník provedeného M. Pluskalem (1996), který konstatuje, že nepřiměřený stupeň obtížnosti zmiňovaných učebnic zpravidla není dán syntaktickou, ale sémantickou stránkou textu (Průcha 1998, s. 69). Myslím, že je to tím, že větné konstrukce jsou autoři učebnic ještě schopni a ochotni zjednodušit / tvořit jednoduché, nejsou ale schopni slevit z odbornosti jako takové, která je jejich propriem a která se projevuje primárně v sémantice (syntax je jen její formou).

Rozbor konkrétního textu

Původně jsem měl v úmyslu porovnat vzájemně více textů a/nebo použít na jeden text pro srovnání více metod, komplexní metoda tria Nestlerová – Průcha – Pluskal se ale ukázala natolik obsáhlá a také problematická, že jsem od tohoto původního záměru upustil. Místo toho jsem provedl zevrubnou analýzu (a zároveň kritiku) této metody.

Pro rozbor jsem tedy nakonec zvolil pouze učebnici pro 8. ročník učebnicové řady SPN - pedagogického nakladatelství – v tomto ročníku se totiž žáci, kteří pracují s touto učebnicovou řadou, seznamují s přístavkem – respektive s „větnými členy v přístavkovém vztahu“ – poprvé.

(V učebnici pro 9. ročník (také s. 91) je v rámci opakování učiva 2. stupně výklad o přístavku také, už nezačíná deduktivně, ale jde jen o výklad (deskripci). Ten zabírá asi tři čtvrtě stránky (ve výkladu pro 8. ročník o něco více – odhadem asi čtyři pětiny). Výklad je odbornější, navíc zavádí značku pro totožnost (≡), kterou „přístavkový vztah v grafickém rozboru můžeme [zvýraznil JJ] naznačit“ (nemá jít tedy o závazné pravidlo, ale jen o možnost?).

Je využito několik grafických prvků, aby se zabránilo jednotvárnosti textu (příklady jsou číslovány, kurzíva, tučné písmo, poučka psána na žlutém podkladě, klíčová spojení jsou vysázena tučně). Výklad se drží české terminologie (obejde se bez terminologie latinské, což je na ZŠ i v odpovídajících ročnících gymnázia případné). Pro přehlednost používá dva druhy závorek.

Pozn. 1: Texty přepisuji přesně tak, jak jsou uvedeny v učebnici (včetně formátování – kurzivy, tučného písma, typu závorek, řádkování apod.). Nejprve uvádím doslovný přepis textu z učebnice/mluvnice, poté již text, ve kterém jsem v kulatých závorkách označil počet vět (modře) a počet sloves (červeně) (1, ...).

Pozn. 2: Protože u jednotlivých veličin jde vždy o součty (sumy), které se za jednotlivá písmena dosazují (V, U, P_x apod.), považuji za zbytečné uvádět symbol Σ.

Text k rozboru

*****

Větné členy v přístavkovém vztahu

1. Tomáš Garrigue Masaryk se narodil v Hodoníně v roce 1850.

Tomáš Garrigue Masaryk byl první československý prezident.

Tomáš Garrigue Masaryk, první československý prezident, se narodil v Hodoníně r. 1850.

2. V dějepise jsme se učili o Přemyslu Otakaru II.

Přemyslu Otakarovi [sic, pozn. JJ] II. se říká král železný a zlatý.

V dějepise jsme se učili o Přemyslu Otokarovi II., králi železném a zlatém.

3. Jako malý chlapec byl Václav I. vězněn svým poručníkem Otou Braniborským na Bezdězu.

Bezděz je známý královský hrad poblíž Doks.

Jako malý chlapec byl Václav I. vězněn svým poručníkem Otou Braniborským na Bezdězu, známém královském hradě poblíž Doks.

4. Tehdy skončila první světová válka.

První světová válka skončila v roce 1918.

Tehdy, v roce 1918, skončila první světová válka.

1. Porovnejte navzájem jednotlivé příklady. Jak je vyjádřen obsah jednotlivých označených vět v příkladech uvedených na posledním místě: větou, nebo větným členem? Kde jsou umístěny čárky?

***

Z více členů se také skládají větné členy v přístavkovém vztahu. Podobně jako u několikanásobného větného členu mají členy v přístavkovém vztahu stejné postavení ve stavbě věty (např. stojí u podmětu /příklad 1/, předmětu /příklad 2/ nebo u příslovečného určení /příklad 3 a 4/).

Na rozdíl od několikanásobného větného členu neoznačují však členy ve vztahu přístavkovém různé jevy, nýbrž označují jev jeden, který různým způsobem pojmenovávají (např. o téže osobě – T. G. Masarykovi – vypovídají, že se narodil v r. 1850 v Hodoníně a že to byl první československý prezident).

Členy v přístavkovém vztahu oddělujeme z obou stran čárkami.

***

(Pozn.: Výklad je doplněn kresbou hradu (bez popisky) – patrně jde o Bezděz)

*****

Zdroj: Hošnová, Eva et al. Český jazyk 8 pro základní školy. 1. vyd. Praha: SPN - pedagogické nakladatelství, 2009. S. 91–92. ISBN 978-80-7235-425-2.

Upravený text I

(1) Z více členů se také skládají (1) větné členy v přístavkovém vztahu. (2) Podobně jako u několikanásobného větného členu mají (2) členy v přístavkovém vztahu stejné postavení ve stavbě věty (např. stojí (3) u podmětu /příklad 1/, předmětu /příklad 2/ nebo u příslovečného určení /příklad 3 a 4/).

(3) Na rozdíl od několikanásobného větného členu neoznačují (4) však členy ve vztahu přístavkovém různé jevy, nýbrž označují (5) jev jeden, který různým způsobem pojmenovávají (6) (např. o téže osobě – T. G. Masarykovi – vypovídají (7), že se narodil (8) v r. 1850 v Hodoníně a že to byl (9) první československý prezident).

(4) Členy v přístavkovém vztahu oddělujeme (10) z obou stran čárkami.

Pozn.: Zkoumám vlastní výklad (tedy výklad v užším slova smyslu, zde jde o text ohraničený dvakrát třemi hvězdičkami („***“)), tedy nikoli příkladové věty, které jistě lze chápat i jako součást výkladu (v širším slova smyslu – mezi dvakrát pěti hvězdičkami („*****“), jejich započítání by bylo ale podle mého názoru spíše ke škodě věci, protože by bylo zavádějící – příkladové věty obsahují na jednu stranu poměrně málo „hutný“ (náročný) text, na druhou stranu obsahují faktografické pojmy, které s mluvnickým výkladem nesouvisí (např. Přemysl Otakar II.).

Syntaktická obtížnost (T_s)

Počet slov[1]: 98 (pozn.: Word 2003 napočítá 100)

Počet vět[2]: 4

Průměrná délka věty: V = N/V (počet slov / počet vět) = 98/4 = 24,5

Průměrná délka větných úseků[3]: U = N/U (počet slov / počet sloves) = 98/10 = 9,8

Syntaktická obtížnost: T_s = 0,1 · V · U = 0,1 · 24,5 · 9,8 = 24,01

Vlastní interpretace tohoto postupu

1) Čím delší věty (čím více slov ve větě), tím těžší text (souhlasím)

2) Čím více sloves / „větných úseků“, tím těžší text (problematické, nebylo dokázáno a dle mého názoru nejde o plausibilní informaci)

3) Překvapí nás koeficient 0,1, jehož jediným opodstatněním asi je, abychom mohli pracovat s nižšími čísly (při výsledcích s alespoň jedním vyjádřeným desetinným místem ale místo „na papíře“ neušetříme...).

Sémantická obtížnost (T_p)

Stanovíme počet jednotlivých druhů pojmů:

P₁ (běžné pojmy) (modře)

P₂(odborné pojmy) (červeně)

P₃(faktografické pojmy) (zeleně)

P₄(číselné údaje) (šedě)

P₅(opakované pojmy)

Pozn. 1 – ad P₁: Běžnými pojmy nejsou všechna „ostatní“ (běžná) slova, ale pouze všechna podstatná jména, která v textu zůstanou po „odfiltrování“ pojmů P₂aP₃(Průcha 1998, s. 62 a 137–138).

Pozn. 2 – ad P_2,P₃: Napadne nás námitka: jaký je rozdíl mezi odborným (P₂) a faktografickým (P₃) pojmem, kde toto autoři definují? Průcha je si vědom určité vágnosti v této věci a proto poznamenává, že „ve sporných případech je nutno se opírat o terminologické slovníky nebo konzultovat příslušné odborníky“ (Průcha 1998, s. 137). (Vycházíme zde intuitivně a analogicky z příkladů, které Průcha k jednotlivých skupinám uvádí.)

Dostáváme se také do potíží s rozlišením, co je běžný (P₁) a neběžný (P₂neboP₃) pojem. Jména T. G. Masaryk a Hodonín jsem původně vzhledem k příkladům uvedeným u P₃zařadil do faktografických pojmů (P₃), pod vlivem příkladů uvedených u P₁ale měním klasifikaci obou na P₁ (běžné pojmy).

Pozn. 3 – ad P₄:Není uvedeno, zda se počítají číslovku vyjádřené číslicí i slovem, předpokládám tedy, že ano.

Pozn. 4 – ad P₅: Není uvedeno, zda jde o opakování významu, nebo formy – tak by např. (v hypotetickém textu) spojení větné členy v přístavkovém vztahu a přístavky v jednom případě byly a v druhém nebyly opakováním téhož (izotopní). Protože jde ale o opakování téhož výrazu, budeme počítat pouze s opakováním formy.

Další otázka, která vyvstává, je, zda se negované sloveso počítá jako opakovaný výraz (P₅), nebo ne – formálně vzato jde o jiný řetězec znaků, funkčně syntakticky a sémanticky jde ovšem o tentýž význam, pouze modifikovaný negací. Vzhledem k tomu, že tato operace představuje zanedbatelnou zátěž pro myšlení, považuji v této studii negované pojmy za pojmy opakované (v tomto textu neoznačují a označují).

Také není explicitně ošetřeno, zda má na hodnocení vliv slovní pořádek; je–li sousloví uvedeno s jiným slovosledem, počítám je jako opakovaný výraz.

Další otázkou je parciální opakování – větné členy v přístavkovém vztahu x větné členy (dva podpřípady: pokud se jimi myslí a nemyslí zmiňované větné členy v přístavkovém vztahu). V daném textu chápu větné členy v přístavkovém vztahu a členy v přístavkovém vztahu jako opakující se výraz.

Upravený text II

Členy v přístavkovém vztahu oddělujeme z obou stran čárkami.

P₁ (běžné pojmy): 11

P₂(odborné pojmy): 10

P₃(faktografické pojmy): 1 (československý prezident)

P₄(číselné údaje): 1 (1850) (odkazy (příklad 1–4) se nepočítají)

P₅(opakované pojmy): 3 (větné členy v přístavkovém vztahu, několikanásobný větný člen a příklad)

Pozn. 1 – ad P₂(ale teoreticky i v jiných kategoriích): Je otázka, zda by se neměla vzít v poraz (vážit) i složitost pojmu. Takto např. několikanásobný větný člen, protože označuje jednu entitu, započítáme jako jeden pojem (P₂). Ovšem text, v němž se objevují takto složité termíny, bude evidentně náročnější než text, ve kterém by místo několikanásobný větný člen bylo uvedeno třeba přísudek – který bude ovšem také započten jako 1 (podobně např. přísudek x přísudek jmenný se sponou apod.). Nevhodnost tohoto způsobu výpočtu se ukazuje hned v prvním řádku našeho textu: máme–li se důsledně držet dané metodiky, musíme větné členy v přístavkovém vztahu (5 slov a vlastně 2 netriviální pojmy) započítat jako 1 pojem.

Pozn. 2 – ad P₃, P₄: Otázkou je, zda je spojení československý prezident jeden nebo dva faktografické pojmy; vzhledem k tomu, že toto sousloví označuje jednu entitu, jsem se přiklonil k pojetí, že jde o jeden pojem.

Pozn. 3 – ad P₅: Otázkou je, proč by mělo opakování výrazů text nutně zesložiťovat – není tomu (často) spíše naopak (neměly by mít spíše než 2 např. koeficient 0,5?!)?

Také není uvedena důležitá metodologická informace, a sice, jestli se opakující se pojmy počítají každý jen jednou (type), nebo zda se počítá s počtem, kolikrát se v textu vyskytly (token) (počítám s první možností) (ve druhém případě by vycházela vysoká obtížnost textu např. tehdy, kdyby každé druhé slovo textu znělo slovo, což by bylo patrně zavádějící...).

Stejně tak není uvedeno, zda se slova, když je počítáme do kategorií P_1–4(nikoli P₅), počítají jako jeden pojem, nebo se uvádí jejich celkový výskyt (počítám s druhou možností – ve sledovaném textu např. případ slova příklad).

Sémantická obtížnost (T_p)

T_p= 100 · P/N · (P₁+ 3P₂+ 2P₃+ 2P₄+ P₅)/N

P = P₁+ P₂+ P₃+ P₄+ P₅= 11 + 10 + 1 + 1 + 3 = 26

T_p= 100 · 26/98 · (10 + 30 + 2 + 2 + 3)/98 = 100 · 0,27 · 0,48 = 12,96

Pozn. 1: P je „počet všech pojmů“ (Průcha 1998, s. 62), čili patrně P₁+ P₂+ P₃+ P₄+ P₅(nikde to ovšem není explicitně definováno).

Pozn. 2: Ve výpočtech zaokrouhluji na dvě desetinná místa.

Celková obtížnost (T)

Celková obtížnost se vypočítá jako součet syntaktické a sémantické obtížnosti:

T = T_s+T_p

T = 24,01 + 12,96 = 36,97

Interpretace výsledků

Průcha 1998 (s. 138) reprodukuje výsledky Pluskalových měření. Pluskal naměřil u učebnic pro základní školy celkovou obtížnost 42,09 (a u učebnic pro gymnázia 51,71). V tomto srovnání vychází výsledek 36,97 dosti podobně, avšak o něco příznivěji než v Pluskalově případě. Vzhledem k místy nejasné metodice je ovšem validita tohoto propočtu nejasná.

Závěr

Závěrem bych řekl, že pojetí, které Průcha 1998 prezentuje, chybí definování pojmů, a tedy také jednoznačnost. Jednak není jasné, jak dospěl k předkládané metodice (validita = ?), jednak není jednoznačné, jak má probíhat její aplikace. I tak lze jistě pomocí předložených vzorců získat alespoň rámcovou představu o obtížnosti daného textu, problém je ale v reliabilitě výsledků (pokud by dva výzkumníci pochopili sporné body různě, nebudou jejich výsledky validně poměřitelné).

Literatura

Hošnová, Eva et al. Český jazyk 8 pro základní školy. 1. vyd. Praha: SPN - pedagogické nakladatelství, 2009. 160 s. ISBN 978-80-7235-425-2.

Průcha, Jan. Učebnice: teorie a analýza edukačního média: příručka pro studenty, učitele, autory učebnic a výzkumné pracovníky. Brno: Paido, 1998. 148 s. ISBN 80-85931-49-4.

[1] „Slovem“ se rozumí i čísla, zkratka a značky, nikoli ale typografické a interpunkční znaménka (čárky, závorky, pomlčky apod.).

[2] „Věta“ se definuje jako jakákoli posloupnost slov začínající velkým písmenem a končící tečkou nebo jiným grafickým znakem (včetně např. rámečku (?!)).

[3] Větný úsek je definován jako část věty nebo věta obsahující sloveso v určitém tvaru. Složené slovesné tvary se počítají jako jedno sloveso.

Komentáře

Přehled komentářů

Chyba v textu článku

(Daniel, 9. 5. 2013 12:59)

Rozbor konkrétního textu
4. "Tehdy, v roce 1918, skončila první světlová válka."

Chyba: "světlová" (nadbytečné písmeno "l")

Odpovědět

Re: Chyba v textu článku

(Jiří Janíček, 13. 5. 2013 10:59)

Opraveno, díky. Jestli se můžu zeptat: jak jste se k tomuto textu dostal/a? A co říkáte na celek - nejsou chyby v něčem zásadnějším?

Odpovědět

Menu

suny