MATEMATICKÁ TEORIE ROZHODOVÁNÍberka/docs/MaTR/MaTR_02.pdf · VYSOKÁ ŠKOLA FINANČNÍ A...

13
VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s. MATEMATICKÁ TEORIE ROZHODOVÁNÍ Podklady k soustředěč. 2 Reprezentace a zpracování znalostí 1. dílčí téma: Reprezentace znalostí V polovině 70. let se začal v umělé inteligenci přesouvat důraz od hledání univerzálního algoritmu pro řešení široké třídy úloh k práci se specializovanými znalostmi z určité oblasti. Tento trend našel své vyjádření v expertních systémech. Expertní systém můžeme chápat jako inteligentní počítačový program, který užívá znalosti a inferenční procedury k řešení problémů, které jsou natolik obtížné, že pro své řešení vyžadují významnou lidskou expertízu. Znalosti nezbytné k činnosti plus použitá inferenční procedura mohou být chápány jako model expertízy nejlepších praktiků v oboru. 1.1 Základní pojmy Znalost je lidský odhad uložený v mysli, získaný pomocí zkušeností a interakcí s okolním prostředím. Znalost je fyzický, mentální nebo elektronický záznam o vztazích, o kterých věříme, že existují mezi skutečnými či imaginárními entitami, silami, jevy, Znalost je vnitřní náhled, porozumění a praktické know-how, které všichni ovládáme – je to základní zdroj, který nám umožňuje chovat se inteligentně Znalosti: Explicitní: formalizované, artikulované a tedy sdílené. Implicitní: primárně skryté (v datech) ale potenciálně formalizovatelné a tedy i sdělitelné. Tacitní: nevědomé a nesdělitelné znalosti skryté v myslích jedinců – expertů. Znalosti: Deklarativní: zachycující co platí (statické pravdy) Procedurální: zachycující jak postupovat při provádění nějakých akcí (usuzování) V klasickém pojetí je získávání znalostí (např. pro expertní systémy) založeno na získávání znalostí od expertů. Zpočátku mělo získávání znalostí podobu transferu znalostí: znalostní inženýr přebíral znalosti od experta a přímo je vkládal do expertního systému. Takto vytvářené báze znalostí jsou ale obtížně modifikovatelné a přenositelné. Nebývají v nich totiž rozlišeny statické znalosti, týkající se celé aplikační oblasti a znalosti vztahující se k řešení dané konkrétní úlohy. Proto dochází na přelomu 80. a 90. let ke změně pohledu na proces získávání znalostí. Tento proces začíná být chápan jako modelování znalostí, tedy jako tvorba přehledných a opakovaně použitelných modelů dané úlohy. Znalosti jsou tedy zachycovány nezávisle na odvozovacích mechanizmech a formalizmu reprezentace znalostí konkrétního expertního (znalostního) systému. Výhody tohoto přístupu jsou v zásadě dvojí: usnadnění vývoje aplikace: model vede tvůrce systému k lepšímu strukturování řešené úlohy, sdílení a opakované používání: pokud jsou modely založeny na standardizované terminologii, pak jsou srozumitelné nejen tvůrcům aplikace ale celé komunitě. 1

Transcript of MATEMATICKÁ TEORIE ROZHODOVÁNÍberka/docs/MaTR/MaTR_02.pdf · VYSOKÁ ŠKOLA FINANČNÍ A...

Page 1: MATEMATICKÁ TEORIE ROZHODOVÁNÍberka/docs/MaTR/MaTR_02.pdf · VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s. MATEMATICKÁ TEORIE ROZHODOVÁNÍ Podklady k soustředění č. 2 Reprezentace

VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s.

MATEMATICKÁ TEORIE ROZHODOVÁNÍ

Podklady k soustředění č. 2

Reprezentace a zpracování znalostí

1. dílčí téma: Reprezentace znalostí V polovině 70. let se začal v umělé inteligenci přesouvat důraz od hledání univerzálního algoritmu pro řešení široké třídy úloh k práci se specializovanými znalostmi z určité oblasti. Tento trend našel své vyjádření v expertních systémech. Expertní systém můžeme chápat jako inteligentní počítačový program, který užívá znalosti a inferenční procedury k řešení problémů, které jsou natolik obtížné, že pro své řešení vyžadují významnou lidskou expertízu. Znalosti nezbytné k činnosti plus použitá inferenční procedura mohou být chápány jako model expertízy nejlepších praktiků v oboru.

1.1 Základní pojmy Znalost je lidský odhad uložený v mysli, získaný pomocí zkušeností a interakcí s okolním prostředím.

Znalost je fyzický, mentální nebo elektronický záznam o vztazích, o kterých věříme, že existují mezi skutečnými či imaginárními entitami, silami, jevy,

Znalost je vnitřní náhled, porozumění a praktické know-how, které všichni ovládáme – je to základní zdroj, který nám umožňuje chovat se inteligentně

Znalosti:

• Explicitní: formalizované, artikulované a tedy sdílené.

• Implicitní: primárně skryté (v datech) ale potenciálně formalizovatelné a tedy i sdělitelné.

• Tacitní: nevědomé a nesdělitelné znalosti skryté v myslích jedinců – expertů.

Znalosti:

• Deklarativní: zachycující co platí (statické pravdy)

• Procedurální: zachycující jak postupovat při provádění nějakých akcí (usuzování)

V klasickém pojetí je získávání znalostí (např. pro expertní systémy) založeno na získávání znalostí od expertů. Zpočátku mělo získávání znalostí podobu transferu znalostí: znalostní inženýr přebíral znalosti od experta a přímo je vkládal do expertního systému. Takto vytvářené báze znalostí jsou ale obtížně modifikovatelné a přenositelné. Nebývají v nich totiž rozlišeny statické znalosti, týkající se celé aplikační oblasti a znalosti vztahující se k řešení dané konkrétní úlohy. Proto dochází na přelomu 80. a 90. let ke změně pohledu na proces získávání znalostí. Tento proces začíná být chápan jako modelování znalostí, tedy jako tvorba přehledných a opakovaně použitelných modelů dané úlohy. Znalosti jsou tedy zachycovány nezávisle na odvozovacích mechanizmech a formalizmu reprezentace znalostí konkrétního expertního (znalostního) systému. Výhody tohoto přístupu jsou v zásadě dvojí:

• usnadnění vývoje aplikace: model vede tvůrce systému k lepšímu strukturování řešené úlohy,

• sdílení a opakované používání: pokud jsou modely založeny na standardizované terminologii, pak jsou srozumitelné nejen tvůrcům aplikace ale celé komunitě.

1

Page 2: MATEMATICKÁ TEORIE ROZHODOVÁNÍberka/docs/MaTR/MaTR_02.pdf · VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s. MATEMATICKÁ TEORIE ROZHODOVÁNÍ Podklady k soustředění č. 2 Reprezentace

VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s.

Nejnověji se ve znalostním modelování objevuje pojem ontologie. Tento pojem je (na rozdíl od filosofického pojetí, kde ontologie znamená nauku o „bytí“) chápán jako označení domluvené terminologie pro určitou aplikační oblast, která umožňuje sdílení znalostí z této oblasti. Ontologie tedy umožňují formalizovat doménové znalosti:

1. Ontologie tvoří konceptuální popis znalostí – hraje roli meta-úrovně definující, co a v jaké podobě může být ve znalostech obsaženo,

2. Ontologie by měla být sdílitelná – neměla by být určena výhradně pro jedinou aplikaci. Předpokladem sdílitelnosti je přijetí daného způsobu konceptualizace v rámci širší komunity jako jistého standardu,

3. Ontologie je definovaná explicitně – nejde o ústní dohodu, ale o informace zachycené v určitém dokumentu pomocí jistého jazyka.

Existuje řada přístupů k reprezentování znalostí:

• pohled vzešlý z matematické logiky, vychází z toho, že inteligentní usuzování rovná se formální odvozování, typicky dedukce. Prostředky pro reprezentování znalostí zde vycházejí z výrokové resp. predikátové logiky.

• pohled opírající se o psychologický přístup, vidí usuzování jako typicky lidské chování. Prostředky reprezentování znalostí nabízené tímto přístupem jsou rámce a sémantické sítě.

• pohled vycházející z biologie vychází z toho, že klíčem k usuzování je architektura stroje založená na paralelním propojení velikého množství jednoduchých výpočetních jednotek. Nabízený formalismus jsou tedy neuronové sítě.

• pravděpodobnostní přístup propojuje logiku s neurčitostí. Na úrovni reprezentace znalostí našlo toto propojení svůj odraz v bayesovských sítích.

• pojetí vycházející z oblasti ekonomie se zaměřuje na otázku hodnot a preferencí. Je obvykle realizováno v systémech racionálních agentů.

1.2 Výroková logika Jazyk výrokové logiky je tvořen:

• výrokovými proměnnými ….. a,b,c,..,p,q,r • logickými konstantami …..T, F (někdy se píše 1, 0 což je označení, které budeme používat) • logickými spojkami (v pořadí dle priorit) …..¬, ∧, ∨, ⇒, ⇔ • závorkami jakožto pomocnými symboly ….. ( )

Jazyk umožňuje vytvářet formule: • výrokové proměnné a logické konstanty jsou formule (tzv. atomické) • jsou-li ϕ a ψ formule, pak jsou formule i ¬ϕ, ϕ ∧ ψ, ϕ ∨ ψ, ϕ ⇒ ψ, ϕ ⇔ ψ příkladem formule je tedy (ϕ ∨ ¬ψ) ⇒ ¬ψ Pravdivostní hodnoty logických spojek ukazuje následující tabulka

ϕ ψ ¬ϕ ϕ ∧ ψ ϕ ∨ ψ ϕ ⇒ ψ ϕ ⇔ ψ 0 0 1 0 0 1 1 0 1 1 0 1 1 0 1 0 0 0 1 0 0 1 1 0 1 1 1 1

Tab. 1 Pravdivostní hodnoty základních logických spojek

2

Page 3: MATEMATICKÁ TEORIE ROZHODOVÁNÍberka/docs/MaTR/MaTR_02.pdf · VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s. MATEMATICKÁ TEORIE ROZHODOVÁNÍ Podklady k soustředění č. 2 Reprezentace

VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s.

1.3 Predikátová logika Na rozdíl od predikátové logiky, kde jednotlivé výroky byly chápány jako dále nestrukturované, nyní nás bude zajímat vnitřní struktura tvrzení, se kterými budeme pracovat. Tomu odpovídá i použitý jazyk, tvořený:

• proměnnými a konstantami (pro pojmenování objektů světa, o kterém chceme vypovídat), • predikátovými symboly (pro označení relací mezi objekty), • funkčními symboly (pro označení funkcí), • logickými spojkami ….. ¬, ∧, ∨, ⇒, ⇔ • kvantifikátory ……. ∀, ∃

Jazyk predikátové logiky opět umožňuje vytvářet formule, ale s vnitřní strukturou jednotlivých tvrzení. Základním výrazovým prostředkem predikátové logiky jsou termy. Termy jsou buď jednoduché (konstanty nebo proměnné), nebo složené (vzniklé aplikací funkce na termy, tedy např. věk(X)). Formule pak vytváříme podobným způsobem jako ve výrokové logice:

• atomická formule má tvar P(t1,t2,..,tn), kde P je predikátový symbol a ti jsou termy • jsou-li ϕ a ψ formule, pak jsou formulemi i ¬ϕ, ϕ ∧ ψ, ϕ ∨ ψ, ϕ ⇒ ψ, ϕ ⇔ ψ, ∀x ϕ(x),

∃x ϕ(x) Příkladem formulí jsou pak

∀x opice(x) ⇒ savec(x)

(∀ε>0)(∃δ>0) (∀x) |x - a| < ε ⇒ |f(x) – f(a)| < δ

1.4 Pravidla Nejběžnější způsob reprezentování znalostí v expertních systémech je pomocí IF-THEN pravidel. Jde vlastně opět o reprezentaci znalostí založenou na matematické logice. Pravidla mohou být chápána dvojím způsobem; procedurálně:

JESTLIŽE situace PAK akce nebo deklarativně:

JESTLIŽE předpoklad PAK závěr

kde situace, předpoklad a závěr jsou kombinace tvrzení o stavu světa. První (procedurální) interpretace je běžná v generativních expertních systémech; nastala-li příslušná situace, systém provede danou akci. Druhá interpretace odpovídá diagnostickým expertním systémům; je-li splněn příslušný předpoklad, systém odvodí daný závěr. Příkladem první interpretace je pravidlo z generativního systému R1/XCON (Obr. 1), příkladem druhé interpretace je pravidlo z diagnostického systému MYCIN (Obr. 2). IF The current context is assigning devices to Unibus models AND There is an unassigned dual-port disk drive AND The type of controller it requires is known AND There are two such controllers, neither of which has any devices assigned to it, and The number of devices that these controllers can support is known THEN Assign the disk drive to each of the controllers, AND Note that the two controllers have been associated and that each supports one drive

Obr. 1 Pravidlo ze systému R1/XCON

3

Page 4: MATEMATICKÁ TEORIE ROZHODOVÁNÍberka/docs/MaTR/MaTR_02.pdf · VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s. MATEMATICKÁ TEORIE ROZHODOVÁNÍ Podklady k soustředění č. 2 Reprezentace

VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s.

IF The site of the culture is blood, and The identity of the organism is not known with certainty, and The stain of the organism is gramneg, and The morfology of the organism is rod, and The patient has been seriously burned THEN There is a weakly suggestive evidence (.4) that the identity of the organism is pseudomonas

Obr. 2 Pravidlo ze systému MYCIN

1.5 Sémantické sítě Sémantické sítě byly navrženy R. Quillianem v druhé pol. 60. let v rámci prací na porozumění přirozenému jazyku jako model asociativní paměti člověka. Později byly zobecněny jako nástroj reprezentování znalostí v libovolné oblasti.

Obr. 3 Sémantická síť pro reprezentování významu slov přirozeného jazyka

Sémantická síť umožňuje popisovat realitu jako objekty, které jsou navzájem v nějakých vztazích (relacích). Sémantická síť má přirozenou grafovou reprezentaci; objekty jsou uzly a relace mezi nimi jsou hrany v grafu. Relace v sémantických sítích představují základní prostředek pro vyjadřování znalostí. Obr. 4 ukazuje příklad sémantické sítě, která definuje bránu složenou ze tří kostek.

Obr. 4 Příklad sémantické sítě

4

Page 5: MATEMATICKÁ TEORIE ROZHODOVÁNÍberka/docs/MaTR/MaTR_02.pdf · VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s. MATEMATICKÁ TEORIE ROZHODOVÁNÍ Podklady k soustředění č. 2 Reprezentace

VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s.

1.6 Rámce Rámce byly navrženy v polovině 70. let Marvinem Minskym z MIT jako prostředek pro reprezentaci znalostí. Rámce v původní představě měly umožňovat reprezentovat stereotypní situace. Práce s rámci měla být založena na postupném vyplňování stránek, do kterých se zapisují hodnoty položek (vlastnosti). Přitom se hojně využívá předdefinovaných hodnot. Rámce dobře umožňují vyjádřit statické znalosti, tedy nějakou hierarchii pojmů (s použitím položky a_kind_of, zkráceně ako) nebo dekompozici (s použitím položky part_of). Vazba mezi rámci se dá (podobně jako u sémantických sítí) znázornit grafem. Na rozdíl od sémantických sítí ale mají uzly v grafu (rámce) vnitřní strukturu. V současné době rámce pronikly do programovacích jazyků. Zde se pro ně používá název objekty; příslušný styl programování využívající objekty se pak nazývá objektově orientované programování.

Obr. 5 Příklad hierarchie rámců Formalizmus rámců umožňuje zachycovat znalosti v podobě tzv. případů, tedy typických úloh z dané aplikační oblasti, úspěšně řešených v minulosti.

5

Page 6: MATEMATICKÁ TEORIE ROZHODOVÁNÍberka/docs/MaTR/MaTR_02.pdf · VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s. MATEMATICKÁ TEORIE ROZHODOVÁNÍ Podklady k soustředění č. 2 Reprezentace

VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s.

2. dílčí téma: Zpracování znalostí Používané metody zpracování znalostí jsou úzce spjaty s příslušným způsobem reprezentace.

2.1 Výroková logika

2.1.1 Pravdivost formulí Pravdivost formulí se vyhodnocuje na základě přiřazení pravdivostních hodnot (konstant 1 a 0) proměnným (tzv. interpretace). Z hlediska jejich pravdivosti můžeme formule dělit na:

• tautologie – formule, které jsou pravdivé pro libovolné přiřazení (např. ϕ ∨ ¬ϕ)

• kontradikce (nesplnitelné formule) – formule, které nejsou pravdivé pro žádné přiřazení (např. ϕ ∧ ¬ϕ)

• splnitelné formule – formule, pro které existuje interpretace taková, že formule je pravdivá

Pro zjišťování pravdivosti (splnitelnosti) formulí lze použít několik postupů.

Tabulka pravdivostních hodnot

Vyčíslíme pravdivostní hodnotu formule pro všechny možné interpretace (viz příklad tabulky pravdivostních hodnot pro formuli (ϕ ∨ ¬ψ) ⇒ ¬ψ). Nevýhodou tohoto přístupu je, že pro n proměnných obsažených ve formulí existuje 2n interpretací.

ϕ ψ ¬ψ ϕ ∨ ¬ψ (ϕ ∨ ¬ψ) ⇒ ¬ψ 0 0 1 1 1 0 1 0 0 1 1 0 1 1 1 1 1 0 1 0

Tab. 2 Tabulka pravdivostních hodnot

Tablová metoda

Binární strom, v kořenu je formule A u které mě zajímá splnitelnost, v listech ohodnocené seznamy literálů (výroků a negací výroků) vyskytujících se ve formuli A.

Strom je vytvářen tak, že aktuální uzel má jednoho následníka, pokud jednu formuli převádíme na konjunkci dvou formulí (tzv. α pravidla), nebo aktuální uzel má dva následníky, pokud jednu formuli převádíme na disjunkci dvou formulí (tzv. β pravidla).

Ohodnocení listu je buď Ο, neobsahuje-li seznam výrok i jeho negaci (tzv. otevřená větev), nebo ×, obsahuje-li seznam výrok i jeho negaci (tzv. uzavřená větev). Formule je kontradikce, pokud její tablo obsahuje pouze uzavřené větve.

α α1 α2

¬¬ψ ψ

ϕ ∧ ψ ϕ ψ

¬(ϕ ∨ ψ) ¬ϕ ¬ψ

¬(ϕ ⇒ ψ) ϕ ¬ψ

ϕ ⇔ ψ ϕ ⇒ ψ ψ ⇒ ϕ

β β1 β2

ϕ ∨ ψ ϕ ψ

¬(ϕ ∧ ψ) ¬ϕ ¬ψ

ϕ ⇒ ψ ¬ϕ ψ

¬(ϕ ⇔ ψ) ¬(ϕ ⇒ ψ) ¬(ψ ⇒ ϕ)

Tab. 3 Alfa a beta pravidla pro tablo Tedy, pro náš příklad

6

Page 7: MATEMATICKÁ TEORIE ROZHODOVÁNÍberka/docs/MaTR/MaTR_02.pdf · VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s. MATEMATICKÁ TEORIE ROZHODOVÁNÍ Podklady k soustředění č. 2 Reprezentace

VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s.

(ϕ ∨ ¬ψ) ⇒ ¬ψ

/ \

¬(ϕ ∨ ¬ψ) ¬ψ

| Ο

¬ϕ, ψ

Ο

Def: Model formule ϕ je taková interpretace (přiřazení pravdivostních hodnot výrokovým proměnným), že formule ϕ je pravdivá.

2.1.2 Odvozování formulí Při odvozování nás zajímají logické důsledky formulí.

Def: Formule ϕ je logickým důsledkem množiny formulí U, platí-li pro všechny modely množiny formulí U, že formule ϕ je interpretována pravdivostní hodnotou T.

Logický důsledek zapisujeme dvěma možnými způsoby

U ╞ ϕ nebo ϕU

Věta 1: Nechť U ={ϕ1, ϕ2 ,…, ϕn}. Formule ψ je logickým důsledkem množiny U právě když

ϕ1 ∧ ϕ2 ∧ … ∧ ϕn ⇒ ψ

je tautologie.

Věta 2: Nechť U ={ϕ1, ϕ2 ,…, ϕn}. Formule ψ je logickým důsledkem množiny U právě když

ϕ1 ∧ ϕ2 ∧ … ∧ ϕn ∧ ¬ψ

je nesplnitelná formule.

Pro odvozování ve výrokové logice se používá řada pravidel. Patří k nim:

• dedukční pravidlo (modus ponens)

ϕ ⇒ ψ, ϕ ╞ ψ

• modus tollens

ϕ ⇒ ψ, ¬ψ ╞ ¬ϕ

• rezoluční pravidlo

ϕ ∨ ψ, ¬ϕ ∨ ρ ╞ ψ ∨ ρ

• sylogismus

ϕ ⇒ ψ, ψ ⇒ ρ ╞ ϕ ⇒ ρ

• disjunktivní inference

ϕ ∨ ψ, ¬ϕ ╞ ψ

• konjunktivní inference

7

Page 8: MATEMATICKÁ TEORIE ROZHODOVÁNÍberka/docs/MaTR/MaTR_02.pdf · VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s. MATEMATICKÁ TEORIE ROZHODOVÁNÍ Podklady k soustředění č. 2 Reprezentace

VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s.

ϕ, ψ ╞ ϕ ∧ ψ

• zjednodušení

ϕ ∧ ψ ╞ ϕ

• disjunktivní součet

ϕ ╞ ϕ ∨ ψ

Příklad: Dokažte, že {ϕ ∨ ψ, ϕ ∨ ρ, ¬ψ ∨ ¬ ρ} ╞ ϕ

Podle Věty 2 budeme dokazovat, že {ϕ ∨ ψ, ϕ ∨ ρ, ¬ψ ∨ ¬ ρ, ¬ϕ} je nesplnitelná množina formulí (tzv. důkaz sporem). Pro odvozování použijeme rezoluční pravidlo

ϕ ∨ ψ ¬ϕ

\ /

ψ ¬ψ ∨ ¬ ρ ϕ ∨ ρ ¬ϕ

\ / \ /

¬ ρ ρ

\ /

\ /

\ /

spor

Odvození s využitím tabla by mělo podobu:

ϕ ∨ ψ, ϕ ∨ρ, ¬ψ ∨ ¬ρ, ¬ϕ

/ \

ϕ, ϕ ∨ρ, ¬ψ ∨ ¬ρ, ¬ϕ ψ, ϕ ∨ρ, ¬ψ ∨ ¬ρ, ¬ϕ

/ \ / \

ϕ, ϕ , ¬ψ ∨ ¬ρ, ¬ϕ ϕ, ρ, ¬ψ ∨ ¬ρ, ¬ϕ ψ, ϕ , ¬ψ ∨ ¬ρ, ¬ϕ ψ, ρ, ¬ψ ∨ ¬ρ, ¬ϕ

/ \ / \ / \ / \

ϕ, ϕ , ϕ, ϕ , ϕ, ρ, ϕ, ρ, ψ, ϕ , ψ, ϕ , ψ, ρ, ψ, ρ, ¬ψ ,¬ϕ ¬ρ, ¬ϕ ¬ψ, ¬ϕ ¬ρ, ¬ϕ ¬ψ, ¬ϕ ¬ρ, ¬ϕ ¬ψ,¬ϕ ¬ρ, ¬ϕ × × × × × × × ×

Pro aplikaci rezolučního odvozovacího pravidla musíme formule převést do klauzulárního tvaru:

• literál (výrok nebo negace výroku) je klauzule

• disjunkce klauzulí je klauzule

Otázku logické dokazatelnosti lze tedy převést na otázku logické splnitelnosti. Je ale třeba mít na paměti skutečnost, že splnitelnost nějaké množiny formulí (tedy existence modelu) neznamená, že tyto formule ze sebe logicky vyplývají.

8

Page 9: MATEMATICKÁ TEORIE ROZHODOVÁNÍberka/docs/MaTR/MaTR_02.pdf · VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s. MATEMATICKÁ TEORIE ROZHODOVÁNÍ Podklady k soustředění č. 2 Reprezentace

VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s.

Příklad: Podezřelý může být vinen jen tehdy, byl-li v době činu v Praze. Podezřelý byl v době činu v Ostravě. Je nevinen? (převzato z Lukasová)

Označme v výrok „podezřelý je vinen“, p výrok „podezřelý byl v Praze“ a o výrok „podezřelý byl v Ostravě“. Zadání úlohy pak můžeme formalizovat do podoby formulí v ⇔ p, o, ¬v. Z tabulky pravdivostních hodnot pro tyto formule ( ) vidíme, že uvedené tři formule jsou splnitelné (existují dokonce dva modely uvedené v řádcích 2 a 8), ale že z pravdivosti v ⇔ p, o se nedá odvodit jednoznačná pravdivostní hodnota výroku ¬v.

To co pro danou úlohu intuitivně víme (sice pokud byl podezřelý v Ostravě, nemohl spáchat trestný čin v Praze) je potřeba přidat jako další formuli o ⇒¬p. Pak už bude mít množina formulí v ⇔ p, o, ¬v, o ⇒¬p jediný model a formule ¬v bude odvoditelná z formulí v ⇔ p, o a o ⇒¬p.

# v p o v ⇔ p ¬v ¬p o ⇒¬p 1 0 0 0 1 1 1 1 2 0 0 1 1 1 1 1 3 0 1 0 0 1 0 1 4 0 1 1 0 1 0 0 5 1 0 0 0 0 1 1 6 1 0 1 0 0 1 1 7 1 1 0 1 0 0 1 8 1 1 1 1 0 0 0

Tab. 4 Pravdivostní hodnoty příkladu

2.2 Predikátová logika

2.1.1 Pravdivost formulí Podobně jako ve výrokové logice i zde můžeme jednotlivé formule interpretovat, neboli přiřazovat výrazům jazyka objekty z prvků nějaké struktury. Při tzv. substituci můžeme nahradit proměnnou termem (a nikoliv pouze konstantou). Tedy nejen opice(judy) místo opice(x) ale i Q(f(a)) místo Q(x).

Def: Unifikace je taková substituce, kdy navzájem si odpovídající termy v predikátu jsou nahrazeny stejně.

Z hlediska pravdivosti můžeme opět dělit formule na tautologie, kontradikce a splnitelné formule. Pro zjišťování splnitelnosti tentokrát již nemůžeme použít tabulku pravdivostních hodnot (konstant, např. jmen zvířat v ZOO může být veliké množství), používá se tedy tablová metoda. K transformačním pravidlům pro konjunkci (α pravidla) a disjunkci (β pravidla) – viz se přidávají γ pravidla pro obecný kvantifikátor a δ pravidla pro existenční kvantifikátor (Tab. 5).

γ(x) γ(t)

∀x φ(x) φ(t)

¬∃x φ(x) ¬φ(t)

δ(x) δ(t)

∃x φ(x) φ(t)

¬∀x φ(x) ¬φ(t)

Tab. 5 Gama a delta pravidla pro tablo 2.1.2 Odvozování formulí Opět nás budou zajímat logické důsledky množiny formulí a opět se dá použít řada odvozovacích pravidel. Ukažme si jen jedno z nich

9

Page 10: MATEMATICKÁ TEORIE ROZHODOVÁNÍberka/docs/MaTR/MaTR_02.pdf · VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s. MATEMATICKÁ TEORIE ROZHODOVÁNÍ Podklady k soustředění č. 2 Reprezentace

VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s.

Rezoluční pravidlo má v predikátové logice podobu

ϕ(x) ∨ ψ(t), ¬ϕ(y) ∨ ρ(z) ╞ ψ(t) ∨ ρ(t)

kde x, y, z jsou proměnné a t je term.

Použití tohoto pravidla opět předpokládá, že všechny formule jsou v klauzulární formě. Libovolnou formuli můžeme převést na klauzulární tvar následujícím postupem:

1. přejmenování proměnných

2. odstranění implikace (převedení ϕ ⇒ ψ na ¬ϕ ∨ ψ)

3. zmenšení oboru platnosti negace (přesunutí negace co nejblíže k atomické formuli, např. podle deMorganova pravidla)

4. vyloučení existenčního kvantifikátoru (tzv. skolemizace)

5. převod na prenexní normální tvar (přenesení všech obecných kvantifikátorů před formuli)

6. převod na konjunktivní normální tvar (konjunkce disjunkcí)

7. odstranění obecných kvantifikátorů

Příklad (Lukasová): Každý, kdo má rád zvířata, nenosí kožichy. Každý, kdo jde s módou nosí kožichy. Brigitt Bardotová (BB) má ráda zvířata. Lze odvodit, že BB nejde s módou?

Nejprve vyjádříme předcházející tvrzení jako formule predikátového počtu:

P1: ∀x (má_rád(x,zvířata) ⇒ ¬nosí(x,kožichy))

P2: (∀x) móda(x) ⇒ nosí(x,kožichy)

P3: má_rád(BB,zvířata)

Závěr: ¬ móda(BB)

Pak převedeme všechny formule na klauzule:

¬má_rád(x,zvířata) ∨ ¬nosí(x,kožichy)

¬ móda(x) ∨ nosí(x,kožichy)

má_rád(BB,zvířata)

¬ móda(BB)

Odvození pak provedeme (s využitím rezolučního principu) jako důkaz sporem. Budeme tedy zjišťovat splnitelnost formulí

¬má_rád(x,zvířata) ∨ ¬nosí(x,kožichy), ¬móda(x) ∨ nosí(x,kožichy), má_rád(BB,zvířata), móda(BB)

| / / /

¬má_rád(x,zvířata) ∨ ¬móda(x) / /

\ / /

10

Page 11: MATEMATICKÁ TEORIE ROZHODOVÁNÍberka/docs/MaTR/MaTR_02.pdf · VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s. MATEMATICKÁ TEORIE ROZHODOVÁNÍ Podklady k soustředění č. 2 Reprezentace

VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s.

\ / /

¬móda(BB) /

\ /

\ /

\ /

\ /

spor

Z odvození vyplývá, že za předpokladů P1, P2 a P3 Brigitt Bardotová skutečně nejde s módou.

2.3 Pravidla Hledání aplikovatelného pravidla se v expertních systémech může provádět dvojím způsobem:

Zpětné řetězení (backward chaining) je typický způsob práce inferenčního mechanismu v diagnostických expertních systémech. Při odvozování metodou zpětného řetězení vycházíme cílů, které chceme odvodit a pokoušíme se nalézt pravidla umožňující tyto cíle potvrdit nebo vyvrátit. V bázi znalostí existují pravidla, která mají tento cíl ve svém závěru Tato pravidla se tedy pokoušíme aplikovat (za použití dedukce). Abychom zjistili, zda je pravidlo aplikovatelné, musíme vědět, zda platí jeho předpoklad. Pokud je v předpokladu dotaz (např. zvýšená_teplota), lze se na jeho pravdivost zeptat uživatele, Pokud je v předpokladu mezilehlý výrok (např. horní_cesty_ dýchací), musíme ho odvodit (podobně jako cíl) z pravidel, která k němu vedou. Celý proces se tak opakuje (viz Obr. 6 ).

Obr. 6 Zpětné řetězení

Při přímém řetězení (forward chaining) vycházíme z faktů, které jsou splněny a pokoušíme se nalézt aplikovatelná pravidla. Z aplikovatelných pravidel lze odvodit nějaký závěr, to umožní nalézt další aplikovatelná pravidla a v odvozování lze pokračovat. Podobně jako u zpětného řetězení, i zde lze využívat priority pravidel. Přímé řetězení v čisté podobě znamená, že systém už se uživatele na nic neptá; všechny odpovědi musí být zadány před začátkem konzultace (Obr. 7).

11

Page 12: MATEMATICKÁ TEORIE ROZHODOVÁNÍberka/docs/MaTR/MaTR_02.pdf · VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s. MATEMATICKÁ TEORIE ROZHODOVÁNÍ Podklady k soustředění č. 2 Reprezentace

VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s.

Obr. 7 Přímé řetězení

Způsob použití vybraného pravidla pak vychází z dedukce známé z výrokové logiky - pokud platí předpoklad pravidla, platí i jeho závěr:

ϕ ⇒ ψ, ϕ ╞ ψ

2.4 Rámce Vzhledem k tomu, že rámce obvykle vytvářejí hierarchickou strukturu, základní odvozovací mechanismus je dědění v rámci této hierarchie. V zásadě lze dědit položky i hodnoty položek. Standardní je přitom dědění směrem „shora dolů“, neboli od obecnějšího konceptu (např. auto) ke speciálnějšímu konceptu (osobní auto); dědit lze ale i zdola nahoru. Pokud je možné násobné dědění (pro nějaký rámec je více možností, jak dědit), dědění hodnot může vést k inkonsistencím (Obr. 8).

Obr. 8 Je nebo není Nixon pacifista?

Rámce můžeme použít i pro reprezentaci typických případů z dané aplikační oblasti. Pak mluvíme o případovém usuzování, které je založeno na podobnosti mezi případy. Pro vyjádření podobnosti resp. vzdálenosti se používá nějaká metrika, neboli funkce d splňující následující vlastnosti:

1. ∀x1,x2 ∈ X; d(x1,x2) ≥ 0

12

Page 13: MATEMATICKÁ TEORIE ROZHODOVÁNÍberka/docs/MaTR/MaTR_02.pdf · VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s. MATEMATICKÁ TEORIE ROZHODOVÁNÍ Podklady k soustředění č. 2 Reprezentace

VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s.

2. d(x1,x2) = 0 ⇔ x1 = x2

3. d(x1,x2) = d(x2,x1)

4. ∀x1,x2,x3 ∈ X; d(x1,x2) + d(x2,x3) ≥ d(x1,x3)

V nejjednodušší situaci (jsou-li případy reprezentovány hodnotami numerických veličin) může být funkce d definována jako

dE(x1,x2) = ∑j=1

mδE(x1j,x2j) , kde δE(x1j,x2j) = (x1j - x2j)2

neboli jako eukleidovská vzdálenost. Odvozování je pak založeno na nalezení toho případu v bázi případů, který má nejmenší vzdálenost k uvažované rozhodovací situaci. Inferenční cyklus případového usuzování dle [Watson, Marir, 1994] vidíme na Obr. 9. V kroku retrieve se k danému problému hledá nejpodobnější případ v bázi případů. V kroku reuse se použije navržené řešení, které je možno případně revidovat v kroku revise. V kroku retain se uchovává nové řešení v bázi případů.

Obr. 9 Odvozování v systémech případového usuzování

13