Tip:
Highlight text to annotate it
X
Det vil være en godt at introducere noget grundlæggende terminologi
som oftest anvendes indenfor kunstig intelligens til at skelne mellem forskellige typer af problemer.
Det første ord jeg vil lære dig er helt og delvist observerbar.
Et miljø kaldes for fuldt observerbart hvis det, som din agent kan opfatte,
på ethvert givent tidspunkt er tilstrækkeligt til at foretage en optimal beslutning.
Eksempelvis gælder det i mange kortspil,
at når alle kort er på bordet, er tilstædeværelsen af alle disse kort
faktisk tilstrækkeligt til at foretage en optimal beslutning
Det står i modsætning til andre miljøer hvor du har behov for at agenten
anvender sin hukommelse til at foretage det bedst mulige valg.
For eksempel i poker-spil, ligger kortene ikke åbent på bordet,
og det at huske tidligere handlinger vil derfor hjælpe dig til at træffe et bedre valg.
For fuldt at forstå forskellen, så betragt en agents interaktion
mellem miljøet og agentens sensorer og aktuatorer,
og denne interaktion forløber over en masse cykler,
hvilket ofte kaldes for 'the perception-action cycle'.
For mange miljøer gælder det, at man med fordel kan antage,
at miljøet har en slags intern tilstand.
For eksempel i kortspil hvor kortene ikke ligger frit fremme på bordet,
kan tilstanden henvise til kortene i din hånd.
Et miljø er fuldt observerbart hvis sensorer til enhver tid kan se
samtlige tilstande i miljøet.
Det er delvist observerbart hvis sensorer kun kan se en del af tilstanden,
således at det at huske tidligere opmålinger giver os yderligere information om tilstanden
der ikke umiddelbart kan observeres.
Så ethvert spil -- for eksempel, hvor tidligere træk indeholder information om
hvilke kort en spiller har på hånden -- disse spil er delvist observerbare,
og de skal behandles anderledes.
Meget ofte vil agenter, der har med delvist observerbare miljøer at gøre,
have brug for intern hukommelse til at forstå hvilken
tilstand miljøet er i, og vi vil tale indgående,
når vi taler om Hidden Markov Models omkring hvordan denne struktur
har en sådan intern hukommelse.
En anden terminologi for miljøer handler om hvorvidt miljøet
er deterministisk eller stokastisk.
Et deterministisk miljø er et hvor din agents handlinger
er den eneste afgørende faktor for udfaldet.
Så, for eksempel, i skak, er der ingen tilfældigheder når du flytter en brik.
Effekten af at flytte en brik er fuldstændig forudbestemt,
og det gælder uanset hvor jeg flytter min brik hen -- udfaldet vil være det samme.
Det kalder vi for deterministisk.
Spil med terninger, som for eksempel backgammon, er stokastiske.
Mens du fortsat kan flytte dine brikker på deterministisk vis,
vil udfaldet af en handling også involvere et terningekast,
som ikke kan forudsiges.
Der er et vist element af tilfældighed involveret i udfaldet af et terningekast,
og derfor kalder vi det for stokastisk.
Lad mig tale om diskret og kontinuert.
Et diskret miljø er et hvor du har et endeligt antal forskellige valgmuligheder,
og et endeligt antal ting du kan observere.
Så, for eksempel, i skak er der et endeligt antal forskellige bræt-positioner.
og der et endeligt antal forskellige ting du kan gøre.
Dette er anderledes end i et kontinuert miljø.
hvor rummet af mulige handlinger eller ting du kan opfatte er uendeligt.
Så, for eksempel, hvis du kaster med dart, er der uendeligt mange måder at sigte darten
og at accellerere den.
Afslutningsvis skelner vi mellem godartede og konkurrenceprægede miljøer.
I et godartet miljø, kan omgivelserne være tilfældige.
Det kan være stokastisk, med det har ikke nogen selvstændig målsætning
der ville stå i modsætning til sin egen målsætning.
Så, for eksempel, vejret er godartet.
Det er givetvist tilfældigt. Det påvirker muligvis udfaldet af dine handlinger.
Men det er ikke rigtigt ude på at få ramt på dig.
Sammenlign det med et konkurrencepræget miljø, så som mange spil som eksempvis skak,
hvor din modstander virkelig forsøger at besejre dig.
Det viser sig, at det er meget sværere at finde gode handlinger i konkurrenceprægede miljøer
hvor modstanderen aktivt observerer dig og modarbejder hvad du forsøger at opnå
relativt til et godartet miljø, hvor omgivelsene muligvis er stokastiske,
men ikke decideret er ude på at gøre livet surt for dig.
Lad os se i hvilken udstrækning disse begreber giver mening for dig
lad os gå til vores næste quiz
Så her er vores 4 begreber igen: delvis observerbart modsat fuldt observerbart,
stokastisk modsat deterministisk, kontinuert mod diskret,
konkurrencepræget mod godartet.
Lad mig stille dig et spørgsmål omkring spillet dam.
Marker en eller flere af de egenskaber der passer.
Så hvis du mener at dam er delvist observerbart, så marker denne.
Ellers bare lad vær med at markere den.
Hvis du mener at det er stokastisk, så vælg denne.
kontinuert, vælg denne, konkurrencepræget, vælg denne.
Hvis du ikke kender til dam, så check det på nettet eller søg på en internetsøgemaskine
for at finde mere information om dam