Potřebnost konstrukcí pro logickou analýzu přirozeného jazyka


Úkolem logiky je zkoumat podmínky vyplývání, zajistit korektnost úsudků. Již Frege, zakladatel moderní logiky, zjistil, že pro tento úkol je zapotřebí určitá analýza vět, které jsou premisami či závěrem. Jedním z cílů logiky je jednoduchost a přehlednost těchto analýz. Proto prostředky na zajištění vyplývání, totiž různé logické systémy, bývají formální, abstrahují od obsahové stránky, zobecňují nad konkrétní odlišnosti. V průběhu statě si ukážeme, že pro analýzu vět vcházejících v úsudky, klasifikují některé logické systémy příliš hrubě, neroztřídí věty podle všech relevantních odlišností, že jsou tedy potřeba systémy, které nám umožní jemnější analýzu. Hlavními důvody pro to, abychom přistoupili na pečlivější, a tedy méně jednoduchý, logický systém, jsou protipříklady, které poukazují, že ten či onen, případ úsudku nejde jednodušším systémem zanalyzovat, prokázat korektnost vyplývání. K tomuto slouží i to, co bychom mohli nazvat ryze filosofickými argumenty. Načrtněme si nyní jistý postup, který vede k uznání velmi rozvinutého a snad nejplauzibilnějšího systému, Transparentní intenzionální logiky (TIL, viz seznam použité literatury), na příkladu několika úsudků.

Jistě nejjednodušším aparátem pro zajištění vyplývání závěru z premis je výroková logika. Každá jednoduchá oznamovací věta je formalizována větnou proměnnou (např. p), určitá souvětí pak jako dvě, či více, proměnných spojených výrokově logickými spojkami (uveďme si zde též Frege-Churchův princip funkcionality (kompozicionality): pravdivostní hodnota celého výrazu závisí na pravdivostní hodnotě jeho částí). Po takovýchto analýzách vět získáváme velmi přehledné schéma úsudku. Aniž bychom se zabývali výrokovou logikou dopodrobna, uveďme si protipříklad:

        Všichni lidé jsou smrtelní.

       Sokrates je člověk.

        Sokrates je smrtelný.

Výroková logika nám premisy a závěr analyzuje jako tři nesouvisející věty, nelze pak prokázat vyplývání rp a q. Výroková logika přehlíží části vět, z nichž je sestaven závěr, který zjevně vyplývá. (Tedy: všechny jednoduché věty jsou analyzovatelné odlišně (p1, p2, …, pn), typ těchto analýz je však stejný (pi).)

Predikátová logika je v analýze vět preciznější, rozlišuje subjekt (např. Sókrata, lidi) a predikát, tj. vlastnost nebo vztah, který je subjektu predikován. Podotýkám, že výroková logika (tj. analýzy souvětí) je ústrojnou součástí predikátové logiky. Nyní stručně (a zhruba) charakterizujme predikátovou logiku. Subjekt je chápán buď jako nějaké konkrétní individuum (zastoupené individuovou konstantou), nebo jako jakékoli individuum daného oboru (individuová proměnná). Predikátem je buď vlastnost, predikovatelná o jednomu individuu, či vztah, predikovatelný o dvojicích, či obecně n-ticích individuí. Obecný a částečný kvantifikátor nám určují, zda-li je predikát aplikovatelný na buď alespoň jedno, či na všechna individua daného oboru. (Složitější predikátová logika druhého řádu je s to pracovat i s predikátovými proměnnými.) Lze lehko nahlédnout, že klasifikace vět a slov v nich přítomných je poměrně bohatá. Přesto je známa řada nedostatků aplikace predikátové logiky při analýzách přirozeného jazyka. Je třeba ovšem podotknout, že predikátová logika má svůj primární účel v matematice, kde sehrála, při zkoumání základů matematiky, významnou roli. Aplikace predikátové logiky pro analýzu přirozeného jazyka je až věc sekundární. Dá se též říci, že predikátová logika principiálně nemůže intenzionálním logikám konkurovat.

Pro odůvodnění kroku k bohatšímu systému je klíčovou neschopnost odlišit slova označující extenzionální a slova označující intenzionální entity. Výrazy pro neempirické a empirické skutečnosti jsou zde analyzovány shodně, extenzionalisticky. Problematičnost tohoto přístupu lze snadno ukázat při rozboru analýz výrazů pro empirické vlastnosti. Extenzí výrazu ´být kočka´ je podle predikátové logiky třída všech aktuálních koček, tedy předmětů, které nesou tuto vlastnost. Avšak my dobře víme, že tato třída se neustále „mění“ (jde o různé třídy), denotát výrazu kočka je nestabilní. Podobně nestabilní je i denotát vět o empirických skutečnostech (pravdivostní hodnoty se mohou měnit, uvažme např. větu „Modřín má jehličí.“). Na aktuálním stavu světa však korektnost úsudků nesmí záviset. (Další problémy rodí analýzy vět hovořící např. o neexistujících entitách. Z toho, že výrazy jednorožec, či vodník denotují prázdnou třídu, vyplývá, že jsou o tomtéž, a to navzdory intuici, že jednorožcem rozumíme koně s jedním vřetenovitým rohem, kdežto vodníkem zeleného panáčka s mokrým fráčkem. Či dále: věty jako „Americký prezident chodí“ jsou v extenzionalistickém pojetí tu o Reaganovi, tu o Clintonovi navzdory tomu, že věta o žádném konkrétním individuu nehovoří, její pravdivost na Reaganovi, či Clintonovi bezprostředně nezávisí. Ba dokonce z pojetí významu vět jako extenzí vyplývá, že jsou jen dvě věty, jedna pravdivá, druhá nepravdivá. Atd.)

Nezbytnost odlišení empirických a neempirických výrazů je zjevná z následujícího úsudku, který není analyzovatelný jinými prostředky, než jakými je intenzionální logika (respektive sémantika možných světů):

        Je nutné, že 9> 7.

       Počet (velkých) planet je 9.

        Je nutné, že počet (velkých) planet je větší než 7.

Substituce v rámci extenzionalismu (Leibnizův princip) tu selhaly, závěr nevyplývá z premis. Ani pomocí aparátu rané modální logiky (což je, řekněme, predikátová logika rozšířená o operátor nutnosti) nejde tento jev rozumně vysvětlit. Nutnost, tj. že je vždy tomu tak, se týká výlučně jen matematických či logických entit. Na rozdíl od nich je svět plný nahodilostí, kontingence. Lze konzistentně myslet, že počet planet je jen pět, není pak tedy nutné, aby počet planet byl větší než sedm. Substituce výrazů o světě za matematické výrazy nesmíme povolit, a to i přesto, že v aktuálním světě je (náhodou) počet nějakých věcí roven nějakému číslu, vždy to tak nemusí být. Je třeba rozlišovat empirické a neempirické výrazy, intenzionální a extenzionální entity, klasifikovat je. Jestliže výraz pro nějakou matematickou vlastnost, třeba být prvočíslem, denotuje třídu, výraz pro empirickou vlastnost, jako být kočka, denotuje v různých okamžicích jinou třídu a dokonce pro každý okamžik jsou myslitelné různé třídy. Tato myslitelnost různých konstelací toho, co by mohlo být pravdivé, vede k teorii možných světů. Aniž bychom se pojmem možného světa zabývali dopodrobna, uvažujme možný svět jako bezrozporný soubor faktů, které mohou platit. Jeden z těchto světů je aktuální svět (připomínám Wittgensteinovo tvrzení, že svět je celkem faktů a nikoli věcí), je to tedy soubor všech aktuálně platných faktů. Mimochodem zjistit, který z možných světů je aktuálním, je úkolem empirických věd (ovšem úkol je to zřejmě nedosažitelný, neboť znát aktuální svět je totéž jako být vševědoucí). Pro každý časový okamžik tedy máme množinu různých možných světů.

Denotát empirických výrazů je závislý na parametru možných světů a parametru časových okamžiků, je (parciální) funkcí na těchto parametrech (tato časová závislost je jedním ze specifik Transparentní intenzionální logiky), takovýmto funkcím se říká intenze (např. denotát věty, totiž propozice, je funkcí z možných světů a časů do pravdivostních hodnot). Na druhou stranu neempirické výrazy mají denotát ve všech možných světech a časech stejný. Denotátem výrazu být prvočíslo je vždy a za všech okolností táž třída. O závislosti na možných světech a časech pak nemusíme uvažovat. Tedy: denotát výrazu počet planet je zjevně funkcí z možných světů a časů do čísel. V aktuálním světě (a přítomném okamžiku) jde o číslo devět. Toto však logická sémantika nemůže vědět, ani zjišťovat, logickou analýzou vět nemůžeme „vypočítávat“ pravdivostní hodnoty. V tomto okamžiku musíme ovšem uvést upozornění, že (v soudobém terminologickém zmatku) běžné intenzionální logiky považují za denotáty právě ony aktuální předměty, a to navzdory tomu, že takováto denotace, kontingentně proměnlivá, nemůže být něčím, co je předmětem logiky. V rámci Transparentní intenzionální logiky se hodnoty intenzí v aktuálním světě, to, k čemu empirické výrazy (navíc) referují, považují za logicky „nevypočitatelné“, reference není předmětem logické sémantiky. To, co běžné intenzionální logiky považují za explikaci Fregova smyslu, tedy funkce z možných světů a časů, intenze (vedle toho jsou extenze denotáty neempirických výrazů), je v Transparentní intenzionální logice chápáno jako denotát (srov. níže schéma). Hned dodávám, že denotáty jsou množinově teoretické objekty, v případě denotátů – funkcí pak každá funkce může být zadána nekonečně mnoha způsoby, konstrukcemi, které jsou explikacemi smyslu.

    Podívejme se nyní na ilustrativní příklad úsudku:

        Pan X ví, že Večernice = Večernice.

       Jitřenka = Večernice.

        Pan X ví, že Jitřenka = Večernice.

Již Frege se domníval, že v nepřímých kontextech, jako Pan X ví (domnívá se, věří, myslí), že … , výrazy nedenotují přímo předměty (individua, třídy, pravdivostní hodnoty), ale své smysly (v případě vět tzv. myšlenky). Výraz Jitřenka tedy v nepřímém kontextu neoznačuje Venuši, ale svůj smysl. Co však smysl je, Frege nevysvětlil, řekl o něm jen, že je to způsob danosti předmětu. Každopádně nežádoucím důsledkem takového pojetí je systematická víceznačnost všech slov v závislosti na kontextu, kontextualismus. Přesto nám speciální kategorie smyslu řeší problém, který nám může znemožnit správnou analýzu některých úsudků, problém tzv. paradoxu analýzy. Nepřijmeme-li něco jako smysl, tento úsudek vyplývá navzdory faktu, že pan X, vědoucí triviální identitu Večernice, nemusí vědět netriviální fakt astronomie o jisté rovnosti Jitřenky a Večernice. Tudíž je třeba vzdát se denotační sémantiky ve prospěch sémantiky smyslu. Intenzionální logiky (iniciačně Carnap, zejména však populární Montagueho systém) jsou takovými sémantikami smyslu, paradox analýzy tedy dokážou řešit.

Naneštěstí intenzionální logiky, jakoby v návaznosti na Fregeho, většinou sdílejí jeho kontextualismus, výraz označuje tu extenzi, tu (v tzv. intenzionálních kontextech) intenzi. Transparentní intenzionální logika však není kontextualistická, některé výrazy denotují extenze, jiné zas intenze (TIL zachovává Frege-Churchův princip extenzionality nejen pro matematické výrazy, transparentní kontexty), význam výrazu je v jakémkoli kontextu týž. Transparentní intenzionální logika tu říká, že např. Jitřenka (což je skrytá deskripce „nejjasnější hvězda ranní oblohy“) je, na rozdíl od Venuše (která je individuem), něčím jiným, je totiž tím, čím Venuše může být (je tzv. individuální rolí, individuálním úřadem). Je myslitelné, že Jitřenkou může být Mars. Výraz Jitřenka tedy denotuje funkci z možných světů a časů do individuí (jako např. Venuše, či Mars), v aktuálním světě pak referuje k Venuši (referent výrazů Jitřenka a Večernice je v tomto aktuálním světě náhodou týž, tyto role jsou koextenzívní).

Odhalením rozdílu mezi výrazy pro extenze a výrazy pro intenze (který se dá při logické analýze podchytit jednoduchou dvousortovou teorií typů) potíže nekončí. Jak uvidíme dále, budeme muset přijmout ještě jemnější (a i složitější) systém, jenž nám umožní zajistit vyplývání i v případě úsudků, které obsahují tzv. paradox vševědoucnosti. Paradox vševědoucnosti je speciálním případem paradoxu analýzy. Náš první příklad úsudku obsahuje tzv. propoziční postoje, druhý pak tzv. pojmové postoje:

        Pan X ví, že 2+3=5.

       (√25 = 5 a 2+3 = √25.) (tato premisa není zde nutná)

        Pan X ví, že √25 = 5.

nebo:

       Pan X počítá 2+3.

        Pan X počítá √25.

Díky analycitě matematiky může být za 2+3=5 dosazena jakákoli pravdivá věta (v případě druhého úsudku ekvivalentní matematický výraz), pravdivostní podmínky pro úsudek se nezmění. Přesto následný závěr není správný - pan X nám tu ví, co vlastně vůbec nemusí vědět, v druhém úsudku pak počítá to, co třeba vůbec nemusí umět počítat.Výraz √25 tudíž nemá stejný význam jako výraz 2+3. (Ani matematické výrazy tedy nemůžeme za sebe v úsudcích tohoto druhu substituovat.) Tento problém se však netýká jen matematických výrazů, každá propozice může být zkonstruována nekonečně mnoha způsoby (představme si např. opakované předsunování negací po dvojicích před nějakou větu). Musíme tedy počítat i se strukturou, kterou výrazy skrývají. Již intenzionální izomorfismus Rudolfa Carnapa nebo strukturované významy Maxe Cresswella měly tuto obtíž (v tzv. hyperintenzionálních kontextech) řešit. Ještě se k oběma vrátíme. TIL uplatňuje pojem konstrukce, kterým předběžně budeme chápat jakousi strukturu, či proceduru.

Nyní si ukážeme dva chybné přístupy k analýze, proti kterým budeme argumentovat ve prospěch pojmu konstrukce.

a) Velmi častým přístupem je, že počítání, či tvrzení znalosti o počítání, vztahuje individuum k výsledku (výsledné hodnotě) dané procedury. Jmenovitě, že pan X, počítá-li 2+3, je vztažen k číslu 5. Namítáme však, že kolikrát počítáme, aniž bychom věděli, co vlastně vypočítáme. Ve škole jsme přeci učeni počítání, tj. aplikaci nějaké operace na vstupy, nikoli výsledkům. Počítání se netýká výsledků procedur, nýbrž těch procedur samotných. Počítání je odlišné od toho být vztažen k nějakému výsledku. Prací každého matematika je přeci úsilí zavádět a tvrdit rovnosti jako např. 2+3 = √25, nikoli tvrdit identity jako 5=5. Oba dva výrazy, 2+3 a √25 sice denotují stejný objekt, číslo 5, avšak dvěma odlišnými způsoby, dvěma intelektuálními cestami, výpočty, procedurami; číslo 5 je konstruováno dvěma odlišnými konstrukcemi.

b) Jiným populárním názorem je tvrzení, že počítání vztahuje individua a výrazy (např. sentencialismus Quinea). Hned namítáme, že je zcela absurdní tvrdit, že ve výrazu pan X počítá 2+3 je míněno totéž, co by správněji bylo zapsáno jako Pan X počítá (je-li takové slovo vůbec na místě)´2+3´. Ve větě Pan X píše 2+3 nelze nahrazovat za (pod)výraz 2+3. Musíme jasně odlišit výraz a entitu, kterou ten výraz označuje. Lingvistický nebo matematický výraz je vždy o objektu odlišném od toho výrazu. Počítání se týká toho, co výrazy znamenají, ne výrazů samých. Když počítáme, konáme matematickou a ne lingvistickou operaci. (Počítání je též odlišné od specifické notace, přesahuje jednotlivé výrazy. Je irelevantní, zda-li pan X počítá 2+3 nebo pan X počítá dva plus tři (či carnapovsky Plus (II, III)). Polský nebo německý logik provozuje tu stejnou výrokovou logiku, ačkoli používají buďto polskou nebo russellovskou notaci.)

Když ty struktury schované za zápisy nejsou ani výsledky (hodnoty nějakých procedur), ani ty výrazy samotné, čím jsou? Jaké jsou to entity? Uvažujme znovu nad naším označovacím schématem: výraz via smysl denotuje denotát a případně pak ještě referuje k něčemu v aktuálním světě. Jeden denotát, tj. intenze, či extenze, je dosažen různými cestami, různými smysly. Upozorňuji, že kategorii smyslu je třeba konstituovat (jednotně) pro všechny entity, nikoli jen pro ty, pro které je víc než jeden výraz. Tichý, jehož pojem konstrukce je explikací smyslu, říká, že konstrukce jsou (časově a prostorově nelokalizovatelné) abstraktními procedurami, které říkají, jak z dílčích částí sestavit celek, jsou to návody k jakoby intelektuálním krokům. Kroky k jednomu objektu, tak jako cesty k jednomu městu, mohou být různé. Názorným příkladem jsou třeba rovnostranný a rovnoúhlý trojúhelník - jde o jeden, týž, objekt, který je však jednou konstruován via rovnost stran, podruhé via rovnost úhlů, obě cesty se liší. V případě 2+3 je funkce sčítání aplikována na číslo dvě a pak číslo tři, ovšem v případě √25 je aplikováno odmocňování na číslo dvacet pět.

Chybným vyjádřením této skladby částí v celek je množina. Množina {+, 2, 3} je prostý seznam prvků, nic víc. Již Bolzano věděl, že pojmy učený syn neučeného otce a neučený syn učeného otce mají stejný obsah, tj. množinu {ne, syn, otec, učený}, a že toto k charakteristice pojmu nestačí. Novozélandský logik Cresswell analyzuje onu strukturu důmyslněji než množinou, chápe ji totiž jako uspořádanou n-tici <+, 2, 3>. Ovšem i zde jde jen o seznam, byť uspořádaný. Nezbavíme se nutnosti stanovovat konvenci, která rozhodne, jaký objekt bude první, který druhý, co bude aplikováno na co. Hledáme tedy taký formální aparát, kde bude role částí jasně definována. Takovýmto aparátem je Churchem objevený lambda kalkul (v jiné podobě Currym navržená kombinatorická logika), rozpracovaný pak na lambda kalkul s typy (typovaný lambda kalkul). Lambda kalkul je aparát, který chápe funkce nikoli jako zobrazení z množiny do množiny, ale jako jisté výpočetní procedury. (Tímto dostává funkcionální sémantika ještě další rozměr.) Rozlišuje tři typy procedur: proměnnou (která vypočítává na základě valuace), aplikaci (která vypočítává hodnotu nějaké funkce na nějakém argumentu) a abstrakci (která je funkcí samotnou, tedy abstrakcí výpočtu pro jakýkoli argument). V našem příkladu je tedy výraz 2+3 vyjádřením aplikace funkce sčítání na dvě a tři. Pořadí je součástí (přesné) definice, je totiž také splněno, že funkce je binární a je na argumentech typu x, dále tu pak máme ony dva argumenty typu x. Příkladem abstrakce je třeba funkční předpis, tedy to jak chápali kdysi funkce (Bernoulli aj.) na počátku 17. století: 2×x2+3 (proměnná x je pak vázána operátorem lambda). Pro rozdíl mezi starým a novodobým pojetím funkce si uveďme ještě výraz y2+y2+2+1, jenž vyjadřuje jiný funkční předpis stejného funkčního zobrazení. Tabulka funkce je nestrukturovaná, funkční předpis ale strukturovaný je, přitom je jedno funkční zobrazení vyjádřitelné (nekonečně) mnoha různými předpisy. Ona strukturovanost funkčního předpisu (zachytitelná v lambda kalkulu) je tím, co jsme hledali.

Pavel Tichý, zakladatel Transparentní intenzionální logiky, tyto lambda termy modifikoval do následujících druhů konstrukcí. Jednak jsou to proměnné, jednoduché konstrukce, které konstruují na základě tzv. valuace. Dále pro identifikaci, tedy bezprostřední, jednokrokové „uchopení“ objektu (ať už denotátu konstanty, či konstrukce), máme trivializaci, jenž konstruuje X bez jakékoli změny. Trivializace je explikací „primitivního smyslu“. Obměnou aplikace pak je kompozice, která poté, co jsou entity identifikovány (zkonstruovány trivializací), aplikuje funkci na n-tici argumentů. Části zde ovšem nejsou ztraceny jako v tabulce funkčního zobrazení, jsou jasně vidět a jejich role je přesnou definicí jasně dána. Hned si uveďme příklad: 2+3 je analyzováno jako [0+ 02 03] , všechny objekty jsou tu trivializovány, role částí, jejich pořadí, návod k složení, je předepsána definicí, která v plné verzi uplatňuje i podmínění homogenností typů objektů (TIL se opírá o modifikovanou rozvětvenou teorii typů). Obměnou lambda abstrakce je uzávěr, tedy určitá konstrukce funkčního zobrazení. Příkladem: 2×x+3 je analyzováno jako [λ x [0+ [0×02 x] 03]] (proměnná zde nemůže být trivializována). Aparát TIL má samozřejmě řadu formálních podrobností, definic, apod. Snad ještě jako dodatek si uveďme analýzu věty Jitřenka je Venuše. Na rozdíl od Venuše, která je individuem, Jitřenka je tím, čím individuum může být, je to funkce z možných světů (w) a časových okamžiků (t) do individuí, tyto proměnné budou muset být vázány operátorem lambda. Věta vypovídá aplikaci rovnosti na zmíněné dva objekty (opět musí být všechny části identifikovány), tedy: [λ w λ t [0= 0Jwt 0V]]. Nebo jiný příklad: to, že Karel počítá 2+3, je věta aplikující empirický vztah počítání na individuum Karel a konstrukci spočívající v aplikování funkce sčítání na dvě a tři, tedy: [λ w λ t [0Počwt 0K 0[ 0+ 02 03] ]] (všimněme si, že predikátová logika by predikát vyjádřila jako Poč(K, ?), neboť onu operaci nedokáže prostě vztáhnout do relace počítat).

Závěrem si řekněme, že porozumět nějakému výrazu znamená vědět, jakou konkrétní konstrukci vyjadřuje (odtud využití pojmu konstrukce v teorii pojmu), přeložit nějaký výraz do jiného jazyka pak znamená vyjádřit výrazem jiného jazyka tutéž konstrukci. O tom, jak důležité jsou konstrukce v našem pojmovém uchopování reality, si ještě uveďme rovněž následující věc. Dvě věty, totiž „Petr je větší než Pavel“, „Pavel je menší než Petr“ nám říkají něco o faktu, který ovšem není nijak dvoustranný - když se Petr a Pavel postaví vedle sebe vidíme jednu skutečnost. Náš jazyk, naše myšlení však tuto skutečnost může uchopit jen skrze dvě různé věty vyjadřující dvě různé konstrukce onoho jednoho faktu.

 

Literatura:

Tichý, Pavel (1996): O čem mluvíme? Vybrané stati k logice a sémantice. Praha: Filosofia, pp. 119–145

Tichý, Pavel (1998): Konstrukce jako předmět matematiky, Filosofický časopis 2, pp. 231–244

Tichý, Pavel (1986): Foundation of Frege´s Logic. Berlin-New York: Walter de Gruyter

Materna, Pavel (1995): Svět pojmů a logika. Praha: Filosofia AV ČR

Materna, Pavel (1998): Concepts and Objects. Helsinki: Acta Philosophica Fennica

ad.

 

Ačkoli zde připojuji schéma denotace, musím doporučit nezkrácené a přesnější Maternovo schéma v Materna 1998 (či na http://www.phil.muni.cz/fil/logika/lapj.html/):

d

výraz

 
e

|

vyjadřuje
n

konstrukce

 
o

|

generuje
t

(pojem)

 
u

|

identifikuje
je

objekt, tj. denotát

(extenze/intenze)

                                    ----------------------------------------------

                                                                referent

kde výraz denotuje objekt, výraz via denotát případně referuje k něčemu v aktuálním světě.

 

 




Published by the Department of Philosophy, Faculty of Arts, Masaryk University, Brno, Czech Republic.
ISSN: 1212-9097